Sunteți pe pagina 1din 245

Asignatura

ESTADSTICA
APLICADA
Manual Autoformativo

Estadstica Aplicada

Pgina 2

ndice de Contenidos
ndice de Contenidos

TEMA 1 INFERENCIA ESTADSTICA: ESTIMACIN

1.1. Introduccin

1.2. Estimacin

1.3. Intervalos de confianza para un parmetro

1.4. Intervalo de confianza para dos parmetros: Intervalo de confianza para la diferencia de medias

TEMA 2 INFERENCIA ESTADSTICA: PRUEBA DE HIPTESIS

18

23

2.1. Conceptos generales

23

2.2. Prueba de hiptesis para una media poblacional ()

24

2.3. Pruebas de hiptesis para una varianza poblacional (2)

27

2.4. Pruebas de hiptesis para una proporcin poblacional (p)

29

2.5. Uso del valor sig proporcionado por el SPSS en sus pruebas

31

2.6. Pruebas de hiptesis para dos varianzas poblacionales

34

2.7. Pruebas de hiptesis para dos medias poblacionales (1 y 2)

36

2.8. Prueba de hiptesis para dos proporciones (p1 y p2)

43

TEMA 3 PRUEBA DE INDEPENDENCIA Y HOMOGENEIDAD DE SUBPOBLACIONES


48
3.1. Prueba de Independencia

48

3.2. Prueba de Homogeneidad de Proporciones

52

Otras pruebas

57

Estadstica Aplicada

Pgina 3

TEMA 4 DISEOS EXPERIMENTALES

58

4.1. Conceptos Bsicos

58

4.2. Diseo Completamente al Azar (DCA)

60

4.3. Pruebas para la diferencia de medias (Comparacin mltiple)

67

4.4. Experimento Factorial AxB.

71

TEMA 5 ANLISIS DE REGRESIN Y CORRELACIN LINEAL SIMPLE

91

5.1.

Anlisis de Regresin Lineal Simple

91

5.1.1

Anlisis de Regresin Lineal Simple

91

5.1.2

Anlisis de Correlacin Lineal Simple.

107

5.2

Regresin no lineal

116

TEMA 6.

REGRESIN LINEAL MLTIPLE

140

TEMA 7.

SERIES DE TIEMPO

167

7.1 Medicin del error en el pronstico

169

7.2 Tcnicas de prediccin

172

7.2.1 Prediccin de tendencia

172

7.2.2 Mtodo de descomposicin de una serie de tiempo

174

TEMA 8. MTODO DE ATENUACIN EXPONENCIAL

199

8.1

TIPOS DE PRONSTICOS:

199

8.2.

Definicin de la atenuacin exponencial

199

8.3

Caractersticas de la atenuacin exponencial con un parmetro (simple)

200

8.4.

Seal de rastreo

200

Estadstica Aplicada

Pgina 4

INTRODUCCIN
Todos los conceptos y aplicaciones vertidos en el curso anterior de Estadstica I tales
como tablas de frecuencia, grficos, clculo de medidas descriptivas se pueden resumir
dentro de un trmino general que vendra a ser ESTADSTICA DESCRIPTIVA, debido que a
travs de ellos podemos describir, presentar y resumir esencialmente el comportamiento de
una serie de datos que han sido recolectados con algn procedimiento adecuado.
Si embargo a travs de la ESTADSTICA DESCRIPTIVA no se puede aclarar
interrogantes acerca de una poblacin cuando no se dispone de ella y solo se tiene parte de
ella, o sea de una muestra. Por ejemplo si sabemos que el rendimiento promedio de una
muestra de automviles de cierto modelo y marca es de 55 km. por galn, qu podremos
concluir acerca de todos los automviles producidos de dicha marca y modelo?
Para poder dar una conclusin acerca de la poblacin, la Estadstica dispone de una
serie de procedimientos y mtodos que se resumen en un trmino general que es el de
ESTADSTICA INFERENCIAL, la cual determina especficamente la probabilidad de que una
conclusin obtenida a partir de una muestra sea vlida para toda la poblacin de la cual
proviene, basados todos ellos en la Estimacin y Prueba de Hiptesis que sern motivo de
estudio en las pginas siguientes.
Es importante manejar adecuadamente los procedimientos y mtodos que utiliza la
estadstica inferencial pues no debemos olvidar que sus resultados sern utilizados por
diferentes entidades y personas quienes se basarn en ellos para poder tomar decisiones y
nosotros tenemos la obligacin moral de entregar la informacin lo ms clara y entendible
posible sin necesidad de tergiversarla ni modificarla.
El presente Manual Autoformativo de ESTADSTICA APLICADA est diseado para
que el lector pueda adquirir los conocimientos necesarios para poder ejecutar los procesos
relacionados con la estimacin y prueba de hiptesis estructurados en cuatro unidades. En
la primera unidad aprenderemos a realizar los distintos mtodos de muestreo que validen
nuestro trabajo y el clculo de intervalos de confianza a travs de las estimaciones, en la
segunda unidad aplicaremos las pruebas de hiptesis a travs de los mtodos paramtricos,
en la tercera unidad continuaremos con las pruebas de hiptesis pero utilizando mtodos no
paramtricos y finalizaremos la cuarta unidad desarrollando el anlisis de correlacin y
regresin el cual nos permitir realizar algunos pronsticos sobre el comportamiento de
alguna variable.
Agradecemos a quienes de antemano tuvieron paciencia y comprensin en la
elaboracin del presente manual, a nuestros amigos de la UPC cuyo texto lo tomamos como
referencia y a aquellos alumnos con quienes pudimos optimizar el uso de la informacin
presente en esta EDICIN.
El Autor

Estadstica Aplicada

Pgina 5

Tema 1 Estimacin de parmetros


1.1. Introduccin
Pensemos en los dos siguientes ejemplos:
1. Hacemos una encuesta entre los clientes de una tienda para preguntarles su opinin
sobre la calidad de la atencin.
2. Revisamos varias de nuestras ventas para ver los montos de stas durante la campaa
de promociones de la tienda.
En los dos ejemplos anteriores se tienen muestras obtenidas, quiz al azar, y se trata de
conocer valores de la poblacin en base a los de la muestra.
Pero hay dos situaciones,
Si solo queremos conocer los posibles valores de la poblacin, por ejemplo la
proporcin de clientes que opinan que el servicio es Malo para el ejemplo 1 o el monto
promedio de las ventas durante la campaa del ejemplo 2, estaramos ante una
estimacin del parmetro en base a la muestra obtenida.
Si tenemos alguna sospecha que deseamos corroborar para tomar accin, por ejemplo
la proporcin de clientes que opinan que el servicio es Malo supera al 40% o la
campaa hace que las ventas aumenten, estaramos ante una prueba de hiptesis que
debemos verificar con la muestra obtenida.
Las acciones obtenidas podran ser capacitar al personal para el ejemplo 1 y realizar cada
cierto tiempo la campaa de promociones para el ejemplo 2.
En los dos casos mencionados vamos a extender el valor de la muestra. Este proceso se llama
inferencia.

Errores en la inferencia
En todo caso el proceso de inferencia est sujeto a errores. No existe magia alguna que haga
que el valor de la muestra coincida con el de la poblacin.
La diferencia entre los valores de la muestra y los de la poblacin crea incertidumbre acerca
de los valores muestrales. Se necesita una manera de establecer las limitaciones del proceso
de inferencia.
Los procedimientos estadsticos no eliminan los errores en la inferencia. Lo que hacen es que
los valores de los errores sean cuantificables mediante afirmaciones de probabilidad. Se dice
que los procedimientos estadsticos son medibles porque es posible medir (en trminos de
probabilidad) la magnitud del error que cometen.
En el ejemplo de los clientes del establecimiento, si obtuvimos una muestra estadstica,
podemos decir no slo cul es el porcentaje de clientes que opinan que el servicio es malo
(por ejemplo 45%, valor en la muestra) sino, adems, con cierta probabilidad (confianza)
podemos afirmar que el porcentaje real se encuentre entre dos valores (entre 43% y 47%, por
Estadstica Aplicada

Pgina 6

ejemplo), o que con cierta probabilidad (error) la proporcin real de personas que opinan que
el servicio es malo supera al 40%.
Afirmaciones como las anteriores se basan en el hecho de que por haber seleccionado al azar,
hay un mecanismo objetivo de generacin de la incertidumbre y mediante deducciones
matemticas es posible encontrar las probabilidades mencionadas. Si la seleccin se hubiese
hecho a juicio, dependera del buen juicio y no de las matemticas el tamao del error en la
inferencia. La medicin de la incertidumbre sera muy complicada y nada confiable.
En la mayora de las veces que hacemos inferencia, las probabilidades las calculamos con el
modelo normal. En algunos casos este modelo normal es el modelo exacto para la inferencia,
pero muy frecuentemente es slo un modelo aproximado.
Podemos por lo tanto concluir que en la estadstica hay dos formas principales de inferir:
Estimacin , y
Prueba de hiptesis
A continuacin presentaremos cada una de estas dos herramientas.

1.2. Estimacin
Para estimar partimos de un modelo probabilstico de cmo se distribuye la caracterstica en
la poblacin o de cmo se realiz el muestreo. Este modelo incluye cantidades que
desconocemos y que llamamos parmetros.
Por ejemplo, en la encuesta para saber la opinin de los clientes, la proporcin de clientes
que opinan que el servicio es Malo es un parmetro (que desconocemos). En el caso de las
ventas del establecimiento, el Monto promedio de las ventas durante una campaa es el
parmetro (que desconocemos).
De la muestra estimamos los valores de los parmetros en la poblacin y esto lo hacemos:
Mediante un valor fijo y entonces decimos que tenemos un estimador puntual o
Mediante un intervalo de posibles valores y le llamamos estimacin por intervalo o
intervalo de confianza.
Como no se puede esperar que un estimador puntual suministre el valor exacto del parmetro
que se desea estimar, se suele calcular una estimacin de dicho parmetro por intervalo.

Estimacin Puntual y por intervalos


Los estimadores puntuales ms comunes son:
La media de la muestra

para estimar el valor promedio en la poblacin .

La proporcin en la muestra

para estimar la proporcin en la poblacin p.

La desviacin estndar de la muestra S como estimacin de la desviacin estndar de


la poblacin .

Estadstica Aplicada

Pgina 7

Supongamos que se desea conocer el sueldo promedio de un egresado de la UPC en su


primer ao de trabajo. Si tomamos una muestra de n = 100 egresados y encontramos que
soles, qu tan probable es que el valor de sea 1700 soles? Luego debemos decir
que =1700 soles es inexacto (pues la media muestral no coincide en general con ). Lo ms
razonable es entonces dar un conjunto de valores que esperamos que contenga a con cierta
probabilidad. As,
P (L1 < < L2) = 1-
P(

<<

) = 1-

Donde (L1;L2) es el intervalos del 100(1-)% de confianza para estimar .

En esta unidad, se muestra cmo obtener una estimacin por intervalo para la media
poblacional , varianza poblacional 2 y para la proporcin poblacional p.
La frmula general para obtener una estimacin por intervalo para la media poblacional es

IC x

margen de error x

e x e; x e

La frmula general para obtener una estimacin por intervalo para la proporcin poblacional
es

IC p p margen de error p e p e; p e

Estadstica Aplicada

Pgina 8


Ejemplo 1.

El 45% opin que la reforma del transporte


que impulsa la Municipalidad de Lima no
tendr xito.
Publicacin de Per 21 lunes 17 de febrero del 2014 de encuestas
Pulso Per
Ficha Tcnica
Encuesta de Datum en Lima Metropolitana (no incluye Callao)

1.3. Intervalos de confianza para un parmetro


Intervalo de confianza para la media cuando se conoce la varianza
poblacional
Para construir un intervalo de confianza, se puede comprobar que la distribucin Normal
Estndar cumple
P(-1.96 < z < 1.96) = 0.95
(lo anterior se puede comprobar con una tabla de probabilidades o un programa
computacional que calcule probabilidades normales).
Estadstica Aplicada

Pgina 9

Luego, si una variable X tiene distribucin N(,2) , entonces el 95% de las veces se cumple:

Despejando en la ecuacin se tiene:

Esto es
El resultado es un intervalo

que incluye a el 95% de las veces. Es decir, es un

intervalo de confianza al 95% para la media cuando la variable X es normal y 2 es


conocido.
Como

es una variable aleatoria entonces los lmites del intervalo de confianza l1 y l2 sern

tambin variables aleatorias mientras no se reemplacen los valores obtenidos en una muestra.

Interpretacin del nivel de confianza

El grfico ilustra la interpretacin del nivel de confianza para el intervalo de confianza para la
media de una distribucin normal con varianza conocida. Para los distintos posibles valores
de la media, representados mediante su distribucin muestral, obtenemos distintos intervalos
de confianza. La mayor parte incluye al valor del parmetro, pero el resto no. Concretamente
el 95% lo incluye y el 5% no, si el nivel de confianza es del 95%.
En la prctica disponemos de una nica repeticin del experimento, y por tanto de un nico
intervalo de confianza, el sealado en negro en el grfico, por ejemplo. Confiamos en que
nuestro intervalo sea de la mayora que contiene al valor objetivo aunque no tenemos la
seguridad de que sea as, tenemos concretamente un riesgo del 5% de equivocarnos.
Estadstica Aplicada

Pgina 10

Intervalo de confianza para la media cuando no se conoce la varianza


poblacional
Generalmente, cuando se quiere construir un intervalo de confianza para la media poblacional
, la varianza poblacional 2 es desconocida, por lo que el intervalo para construido al final
de la seccin anterior es muy poco prctico.
Si en el intervalo se reemplaza la desviacin estndar poblacional por la desviacin estndar
muestral S, el intervalo de confianza toma la forma:

La cual es una buena aproximacin para el intervalo de confianza de 95% para con 2
desconocido. Esta aproximacin es mejor en la medida que el tamao muestral sea grande
(n30).
Cuando el tamao muestral es pequeo (n<30), el intervalo de confianza requiere utilizar la
distribucin t de Student (con n-1 grados de libertad, siendo n el tamao de la muestra), en
vez de la distribucin normal (por ejemplo, para un intervalo de 95% de confianza, los lmites
del intervalo ya no sern construidos usando el valor 1,96).

Estadstica Aplicada

Pgina 11

Margen de error
Si la desviacin estndar o la varianza poblacional son conocidas, el margen de error

ez

1 ,
2

Si la desviacin estndar o la varianza poblacional son desconocidas, el margen de


error e t
2

,n1

s
n

Donde t sigue una distribucin t de student con (n-1) grados de libertad.


Si la poblacin es finita, se usa el factor de correccin por poblacin finita

N n
.
N 1

Distribucin t-Student
Se dice que la variable aleatoria t sigue una distribucin t con k grados de libertad.
Para un valor de la variable aleatoria t,k es tal que el rea a su derecha bajo la curva de la
P(T t ,k )
distribucin t con k grados de libertad es igual a .

Caractersticas
La funcin de densidad es simtrica y forma de campana
El rango es toda la recta real, esto es, de - a +
La grfica de la distribucin t es parecida a la distribucin normal, con media cero pero la
varianza es 2

k
k 2

Cada valor de grado de libertad determina una distribucin t distinta.


Cuando los grados de libertad son altos, los valores de la distribucin t se asemejan con
los valores de la distribucin normal estndar.

Estadstica Aplicada

Pgina 12

Ejemplo 2.
Una empresa fabrica focos que tiene una duracin aproximadamente normal. Si una muestra
de 25 focos tiene una duracin promedio de 780 horas con una desviacin estndar de 28,8
horas.
Estime e interprete, con una confianza del 98%, la duracin media de los focos que produce
esta empresa.

Solucin
Como es desconocida y asumiendo que la poblacin es infinita se usar el margen de error
e t
2

,n1

s
n

Se tiene que la media muestral es x 780 y que el tamao de la muestra es n = 25. El nivel de
confianza requerido es 1- = 0,98, luego = 0,02 y /2=0,01. As el
La desviacin estndar muestral es S= 28,8.

Interpretacin
Con un nivel de confianza del 98% y a partir de la informacin muestral se afirma que el
intervalo [765,6452; 794,3548] horas contiene a la duracin promedio de todos los focos
producidos por la empresa.
Ejercicio 1.
Se desea estimar mediante un intervalo de confianza al 95%, el gasto promedio diario en
alimentacin de los estudiantes de Administracin. Para ello, se tom una muestra aleatoria de
9 alumnos y se les pregunt por su gasto en alimentacin durante el da anterior a la encuesta,
encontrndose los siguientes resultados. Calcule e interprete el intervalo de confianza del
gasto promedio diario.
11,5

10

Estadstica Aplicada

16,5

18,0

7,5

7,5

9,5

14,5

13

Pgina 13

Tabla de la distribucin t-Student

0,40

0,30

0,20

0,15

0,10

0,05

0,04

0,03

0,025

0,020

0,015

0,010

1 0,32492 0,72654 1,37638 1,96261 3,07768 6,31375 7,91582 10,57889 12,70620 15,89454 21,20495 31,82052
2 0,28868 0,61721 1,06066 1,38621 1,88562 2,91999 3,31976 3,89643 4,30265 4,84873 5,64278 6,96456
3 0,27667 0,58439 0,97847 1,24978 1,63774 2,35336 2,60543 2,95051

3,18245

3,48191

3,89605

4,54070

4 0,27072 0,56865 0,94096 1,18957 1,53321 2,13185 2,33287 2,60076

2,77645

2,99853

3,29763

3,74695

5 0,26718 0,55943 0,91954 1,15577 1,47588 2,01505 2,19096 2,42158

2,57058

2,75651

3,00287

3,36493

6 0,26483 0,55338 0,90570 1,13416 1,43976 1,94318 2,10431 2,31326

2,44691

2,61224

2,82893

3,14267

7 0,26317 0,54911 0,89603 1,11916 1,41492 1,89458 2,04601 2,24088

2,36462

2,51675

2,71457

2,99795

8 0,26192 0,54593 0,88889 1,10815 1,39682 1,85955 2,00415 2,18915

2,30600

2,44898

2,63381

2,89646

Tamao de muestra para estimar la media

NOTA: El redondeo es por exceso.


Estadstica Aplicada

Pgina 14

Ejercicio 2.
En una empresa se desea conocer el tiempo promedio que sus empleados tardan en usar los
servicios higinicos al da. Se estima que la desviacin estndar de dicho tiempo es de 10
minutos. Calcule el tamao de muestra si se desea tener un nivel de confianza del 90% y un
margen de error de 2 minutos.

Intervalo de confianza para una proporcin


En este caso, interesa construir un intervalo de confianza para una proporcin o un porcentaje
poblacional (por ejemplo, el porcentaje de clientes morosos, satisfechos con la atencin, etc.)
Si el tamao muestral n es grande, el Teorema Central del Lmite nos asegura que:

O bien:

Donde p es el porcentaje de personas con la caracterstica de inters en la poblacin (o sea, es


el parmetro de inters) y es su estimador muestral.
Luego, procediendo en forma anloga al caso de la media, podemos construir un intervalo de
95% de confianza para la proporcin poblacional p.

Estadstica Aplicada

Pgina 15

Ejemplo 3.
A una muestra aleatoria de 400 personas mayores de 28 aos de una ciudad determinada se
les pregunta si estn a favor de un nuevo impuesto adicional del 4% en el precio de la
gasolina para obtener fondos necesarios que se destinaran a un programa de asistencia social.
Si en la muestra elegida se encontr que 245 estaban a favor del impuesto adicional, estime e
interprete, mediante un intervalo de confianza del 95%, la proporcin de personas a favor del
nuevo impuesto en la ciudad.
Solucin
Primero, calculemos la proporcin muestral p

El intervalo es

245
0,6125
400

p 1 p

0, 6125 1 0 , 6125
IC p p z
0, 6125 1, 96
0, 6125 0, 0244
1
n
400
2

El intervalo de confianza 0,5648; 0,6602 contiene a la proporcin de personas a favor del


nuevo impuesto en la ciudad, con un nivel de confianza del 95%.

Estadstica Aplicada

Pgina 16

Ejercicio 3.
Una encuesta realizada a 1230 adolescentes de Lima sobre su opinin acerca del principal
problema de la juventud, se obtuvieron los siguientes resultados: el 28% opin que era el uso
y abuso de las drogas, el 20% que se deba a la falta de comunicacin con los padres, el 6%
por el uso y abuso del alcohol, el 6% por el desempleo y el resto a otros problemas. Estime e
inteprete, con una confianza del 99%, la proporcin de adolescentes en Lima que consideran
el uso y abuso de las drogas como el principal problema.

Ejercicio 4.
Empresa S.A realiz un estudio a sus trabajadores sobre acuerdos de incentivos, para ello
eligi al azar a 156 trabajadores y obtuvo que 65 trabajadores no estaban de acuerdo con la
poltica de incentivos de la empresa. Estime e interprete, con una confianza del 95%, la
proporcin de trabajadores en la empresa que estn de acuerdo con la poltica de incentivos.

Estadstica Aplicada

Pgina 17

Tamao de muestra para estimar la proporcin

Ejercicio 5.
Empresa S.A desea estimar la proporcin de sus trabajadores que estn a favor de que se
corrija el programa de aseguramiento de la calidad con un margen de error del 2,8% y un
nivel de confianza del 95%. A cuntos trabajadores se debe encuestar?

Estadstica Aplicada

Pgina 18

Ejercicio 6.
En la facultad de una universidad el decano desea estimar la proporcin de alumnos que va al
gimnasio por lo menos una vez a la semana. Cada encuesta costar dos nuevos soles y,
adems, existe un costo fijo de mil nuevos soles. Calcule el costo de la encuesta, si se desea
tener un nivel de confianza del 99% con una amplitud del intervalo de confianza que sea
como mximo del 5%.

Estadstica Aplicada

Pgina 19

1.4. Intervalo de confianza para dos parmetros: Intervalo de


confianza para la diferencia de medias

Para probar que dos muestras provienen de dos poblaciones con varianzas homogneas, se
observara la prueba de Levene que nos otorga el SPSS.
Con el valor de sig que da el reporte del SPSS, se compara con el valor del nivel de
significacin (Alfa).
Regla de decisin:
Si sig < Alfa, entonces la varianzas no son homogneas.
Si sig alfa, entonces la varianzas son homogneas.
Con mayor detalle esto se ver en la siguiente unidad de prueba de hiptesis.

Estadstica Aplicada

Pgina 20

Ejercicio 7.
Un fumador empedernido desea comparar el contenido promedio de alquitrn de dos marcas
de cigarrillo que usualmente fuma A y B para elegir la marca que menos dao le proporcione.
Por lo tanto selecciona una muestra de cigarrillos de ambas marcas y determina el contenido
de alquitrn (miligramos) que se muestran a continuacin:

Marca A

12

13

11

14

10

Marca B

10

10

12

13

11

El fumador supone que las varianzas del contenido de alquitrn de ambas marcas de
cigarrillos son homogneas y estima, con una confianza del 95%, la diferencia del contenido
promedio de alquitrn de los cigarros de marca A y marca B. Cul es la estimacin realizada
por el fumador y qu marca de cigarrillo decidir elegir?

Estadstica Aplicada

Pgina 21

Ejercicio 8.
Estime, con una confianza del 92%, la diferencia de los sueldos promedios de los trabajadores
del sector minero y sector industrial en base a los siguientes resultados de dos grupos de
trabajadores que se han seleccionado al azar de cada uno de estos sectores:
Sector

Media

Desviacin estndar

Minero

14

2100

110

Industrial

11

1850

354

Suponga que las varianzas de los sueldos de los trabajadores de ambos sectores no son
homogneas. Qu sector tiene un mejor sueldo?

Estadstica Aplicada

Pgina 22

Ejercicios propuestos 1.
1. El tiempo de conexin a Internet que usan los alumnos de la UPC sigue una distribucin
normal. Se selecciona al azar a 200 alumnos de la UPC y se obtiene que el tiempo
promedio que tienen acceso a internet es de 75 minutos con una desviacin estndar de
15 minutos.
a) Estime e interprete, con una confianza del 94%, el tiempo promedio de conexin de
todos los estudiantes de la UPC.
b) Para un nuevo estudio, a cuntas alumnos como mnimo sera necesario entrevistar?
para garantizar un error de estimacin de la media poblacional no superior a 0.25 con
un nivel de confianza de 95%.
2. Suponga que los impuestos prediales mensuales es una variable que se distribuye
normalmente, se eligi al azar a 10 personas que pagan sus impuestos prediales
mensuales en el distrito de La Molina y se registr la siguiente informacin:
45.2

32.6

45.3

52.5

48.3

50.2

44.6

47.5

35.6

55.2

Estime e interprete el impuesto predial promedio mensual de las personas que viven en
La Molina con una confianza del 92%.
3. En una editorial se desea evaluar el tiempo promedio de distribucin de su ltima revista
de modas Fashion distribuida al mercado, Para este estudio se desea tener un error de
estimacin de 5 minutos con un nivel de confianza del 92%, si se conoce que la
desviacin estndar del tiempo de distribucin es de 20 minutos. Qu tamao de muestra
debe de emplearse para el estudio?
4. El director de la editorial Peridicos S.A desea estimar la proporcin de personas que
leen el diario Per 20. Para tal fin, selecciona al azar 2100 personas del distrito de San
Borja y se encuentra que 630 leen el diario Per 20. En base a esta muestra estime e
interprete, con una confianza del 90%, la proporcin de personas que leen el diario Per
20.
5. Apoyo S.A realiz un estudio sobre el principal problema de los accidentes
automovilsticos en Lima Metropolitana, para tal fin, eligi al azar a 1200 personas
mayores de edad encontrndose que 1050 consideran que el principal problema de los
accidentes automovilsticos es por estado de ebriedad de los conductores. Estime e
interprete, con una confianza de 99%, la proporcin de personas mayores de edad de
Lima Metropolitana que consideran que el principal problema es el estado de ebriedad en
los conductores.
6. El Ministerio de Educacin y Cultura desea conocer el inters de los padres por la
introduccin de la primera Lengua Extranjera en la educacin primaria. Se seleccion al
azar a 1024 padres, encontrndose 860 a favor de la medida.
a) En base a esta muestra, estime e interprete el porcentaje de padres que estn a favor de
esta medida, con un nivel de confianza del 99%.

Estadstica Aplicada

Pgina 23

c) Para un nuevo estudio, a cuntas padres como mnimo sera necesario entrevistar?
para garantizar un error inferior a 2.5 con un nivel de confianza de 94%.
7. El gerente de operaciones de BANK, est interesado en saber cul de los turnos de
trabajo es ms eficiente. Para ello registr aleatoriamente los tiempos que utilizaron los
empleados para atender a los clientes en dos turnos maana y noche. Los tiempos, en
minutos, son los siguientes:
Turnos de trabajo
Turno maana
Turno tarde

Muestra
14
17

Tiempo de atencin
promedio (minutos)
87,9
92,1

Desviacin
Estndar
3,1
6,4

Asuma que las varianzas de los tiempos de atencin son heterogneas. Asuma normalidad
en la variable en estudio.
Estime, con una confianza del 95%, la diferencia de los tiempos promedios de atencin al
cliente de ambos turnos. Cul de los turnos es ms eficiente?
.
8. El gerente de un banco comercial de Lima quiere evaluar el desempeo de dos sucursales
ubicadas en el distrito de Surco y San Isidro determinado el monto de operacin.
Decide elegir dos muestras aleatorias del total de operaciones realizadas la ltima
semana: 71 en Miraflores y 41 en San Isidro donde se registr, entre otras variables, el
monto de operacin (en dlares). Los resultados se muestran a continuacin:
Sucursal
Surco
San Isidro

Tamao de
muestra
71
41

Monto promedio
por operacin
800
1200

Desviacin estndar del


monto por operacin
180
220

Asuma que las varianzas de los montos por operacin son homogneas. Asuma
normalidad en la variable en estudio.
Estime, con una confianza del 99%, la diferencia de los montos de operacin en las
sucursales de Surco y San Isidro. Qu sucursal ha tenido un mejor desempeo?

Estadstica Aplicada

Pgina 24

Tema 2: Prueba de hiptesis


2.1. Conceptos generales
Una hiptesis estadstica es una suposicin elaborada sobre uno o ms parmetros de la
poblacin o sobre la distribucin de una poblacin. Dicha suposicin puede ser verdadera o
falsa.
La prueba de hiptesis es el procedimiento que nos llevar a verificar o no esta suposicin a
partir de la informacin proporcionada por una muestra. Por lo tanto las conclusiones o
decisiones que se tomen a partir de sta tendrn cierto nivel de incertidumbre que se medirn
en trminos probabilsticos.
La hiptesis nula, denotada por Ho, es la que se supone cierta mientras no se pruebe lo
contrario y con ella se plantean afirmaciones que incluyen siempre la igualdad (=, o ).
En cambio la hiptesis alternante, denotada por H1, es aquella que se declarar como cierta
basada en evidencia estadstica, esto es con la informacin proporcionada por la muestra. H1
es contraria a la Ho y lo que afirma nunca incluye la igualdad (, > o <). La hiptesis alterna
es, suele ser, la hiptesis que el investigador est interesado en verificar.
Cuando el resultado de la prueba de hiptesis es rechazar la Ho, podemos decir que existe
evidencia estadstica para estar a favor de la alternante H1. En cambio, cuando no se
rechaza la Ho podemos decir que no hay evidencia estadstica para estar a favor de H1, por lo
que suponemos que la afirmacin de la hiptesis nula podra ser correcta. Esto es, el hecho de
no rechazar la hiptesis nula no implica que sta sea cierta. Significa simplemente que los
datos proporcionados por la muestra son insuficientes para concluir que H1 es cierta.
Tipos de errores:
Decisin estadstica en base a la informacin
muestral

La
realidad

No rechazar H0

Rechazar H0

H0 es cierta

No hay error

Error tipo I

H0 es falsa

Error tipo II

No hay error

Estadstica Aplicada

Pgina 25

Error Tipo I: Decidir rechazar la H0 cuando sta es verdadera.


Error Tipo II: Decidir no rechazar la Ho cuando sta es falsa.
Nivel de significacin (): es la probabilidad de cometer Error tipo I
P(error I) = P(rechazar Ho / Ho es verdadera) =

El valor (nivel de significacin) es fijado por la persona que realiza la investigacin. Por lo
general vara entre 1% y 10%.
La probabilidad de cometer Error tipo II es denotado por , esto es:
P(error II) = P(no rechazar Ho / Ho es falsa) =

Pasos a seguir en una Prueba de Hiptesis

Paso 1: Planteo de la hiptesis.


Paso 2: Eleccin del nivel de significacin.
Paso 3: Prueba estadstica.
Paso 4: Suposiciones.
Paso 5: Regiones crticas. Criterios de decisin.
Paso 6: Realizacin de la prueba.
Paso 7: Resultados y conclusiones.

2.2. Prueba de hiptesis para una media poblacional ()


Caso: Varianza poblacional desconocida
Ejemplo 4.
La directora del departamento de personal de una importante corporacin est reclutando un
gran nmero de empleados para un puesto en el extranjero. Durante el proceso de seleccin, la
administradora le pregunta cmo van las cosas, y ella responde: Bien, creo que la puntuacin
promedio de la prueba de aptitud sobrepasar el valor de 90. Cuando la administradora revisa
al azar 20 resultados de las pruebas, encuentra que la puntuacin promedio es de 92 con una
desviacin estndar de esta puntuacin es 7. Estos datos le confirman la informacin
alcanzada por la directora del departamento de personal? Asuma que las puntuaciones se
distribuyen normalmente y use un nivel de significancia del 5%.

Estadstica Aplicada

Pgina 26

Solucin
Sea X: Puntuacin en la prueba de aptitud
X~ N( , 2)
1. Planteo de hiptesis:
La puntuacin promedio en la prueba de aptitudes no es mayor a 90

H 0 : 90

H1 : 90

La puntuacin promedio en la prueba de aptitudes es mayor a 90

2. Nivel de significacin:
La probabilidad de decidir errneamente que la puntuacin promedio

0.05

en la prueba de aptitudes es mayor a 90 es 0.05.

3. Estadstico de prueba:
_

x 0
x9 0
T

~t
s/ n s/ n

Como no se conoce la desviacin estndar de la poblacin se usar la


( n1)

4. Supuestos:

distribucin t de Student. Tambin bajo la suposicin que Ho es


verdadera.

a. Poblacin aproximadamente normal.


b. Muestra tomada al azar.
5. Regiones crticas: Criterios de decisin.
La hiptesis alternante define la(s) zona(s) de rechazo.
reas

6.

Clculos:

tc

92 9 0

7 / 20

Criterios

Si

tc 1.73

No se rechaza Ho

Si

tc > 1,73,

Se rechaza H0

Decisin estadstica: No Rechazo Ho.


7.

Conclusin:
Con un nivel de significacin del 5%, la informacin muestral (media de 92) no fue
suficiente para concluir que la puntuacin promedio en la prueba de aptitudes sobrepase

Estadstica Aplicada

Pgina 27

el valor de 90. Por lo que no se ha podido validar la informacin proporcionada por la


directora del departamento de personal.

Ejercicio 9.
El administrador del restaurante FINO debe tomar varias decisiones (con =0.05):
Colocar 5 mesas adicionales si el consumo promedio por mesa es superior a 100 soles.
Para tomar la decisin selecciona al azar una muestra de 10 mesas y anota la cantidad
consumida (en soles)
Mesas

10

Consumo (S/.) 115 120 105 100 117 110 95 121 98 106
Cul es la decisin del administrador con respecto a las mesas adicionales? Suponga que el
consumo por mesa sigue una distribucin normal.

Estadstica Aplicada

Pgina 28

2.3. Pruebas de hiptesis para una varianza poblacional (2)


Ejemplo 5.
Se reporta que la desviacin estndar de la resistencia al rompimiento de ciertos cables
producidos por una compaa es 240 lb. Despus de que se introdujo un cambio en el proceso
de produccin de estos cables, la resistencia al rompimiento de una muestra de 8 cables
mostr una desviacin estndar de 300 lb. Investigue el aumento aparente en la variacin,
usando un nivel de significancia de 0,05. Asuma que la resistencia al rompimiento de los
cables que produce esta compaa se distribuye normalmente.

Solucin:
Sea X: Resistencia al rompimiento de cierto tipo de cable (lb)
2 =

X ~ N( , 2402)

Varianza de la resistencia de los cables despus de modificado el proceso de

produccin.
1.

Planteo de hiptesis:
No aument la variabilidad de la resistencia al rompimiento de
los cables despus de modificar el proceso de produccin.

H 0 : 2 240 2

H : 2 240 2
1

2.

Nivel de significacin:

0,05
3.

Estadstica de prueba:

2
4.

(n 1)s 2

2
o

La probabilidad de concluir errneamente que la variabilidad


aument despus de modificar el proceso de produccin es
0.05.

7 s2
2
~ (7)
2402

La estadstica de prueba se construye sabiendo que la varianza


muestral s2 se distribuye como una Chi-cuadrado con (8-1)
grados de libertad y bajo la suposicin que Ho es verdadera.

Supuestos:

a. Poblacin normal.
5.

Si aument la variabilidad de la resistencia al rompimiento de


los cables despus de modificado el proceso de produccin.

b. Muestra tomada al azar.

Regiones crticas. Criterios de decisin.


La hiptesis alternante define la(s) zona(s) de rechazo.
reas

2
(7)

Criterios de decisin:
Si c2 14,07 No se rechaza H0
Si c2 14,07 Se rechaza H0

6.

Clculos:
c2

La varianza muestral de 300 lb, nos ayudar a tomar la


decisin, sta se transforma a un valor de Chi-cuadrado.

(8 1)300
10,938
2402

Estadstica Inferencial

Luego el valor de la estadstica de prueba es 10.938

Decisin Estadstica: No se rechaza Ho


7.

Conclusin:
No se ha podido probar, con un nivel de significancia del 5%, que la variacin de la
resistencia al rompimiento ha aumentado despus de modificar el proceso de
produccin. Tambin se dice que la informacin muestral (s=300 lb) no fue
significativo, no es lo suficientemente grande para concluir que en verdad > 240 lb.

Ejercicio 10.
El administrador del restaurante FINO debe tomar varias decisiones (con =0.05):
Capacitar a su personal si la desviacin estndar del tiempo que demora en ser atendido
un cliente es mayor a 5 min. Para tomar la decisin selecciona 15 clientes al azar y encuentra
que la desviacin estndar de los tiempos que demoran en ser atendidos estos 15 clientes es
7.8 min. Suponiendo que estos tiempo provienen de una distribucin normal. Deber
capacitar al personal?

Estadstica Aplicada

Pgina 28

2.4. Pruebas de hiptesis para una proporcin poblacional (p)


Ejercicio 11.
RSS, minorista de electrodomsticos, anunci que vende el 21% de todas las computadoras
caseras de una ciudad. El gerente de SSR, su competidor ms cercano, piensa que han sobreestimado esta cifra. Para confirmar su sospecha, selecciona al azar a 700 propietarios de
computadoras caseras de esa ciudad y encuentra que 120 afirman que compraron en RRS.
Estos datos confirman la sospecha del gerente de SSR? Use 0.05 .

Solucin:
Sea p: proporcin de propietarios de computadoras caseras de la ciudad que compraron en
RRS.
1.

Planteo de hiptesis:
Anuncio de RRS

H 0 : p 0, 21

H1 : p 0, 21

Sospecha de SSR

2.

Nivel de significacin: 0.05

3.

Estadstica de prueba:

4.

Supuestos:

a.

Muestra tomada al azar. b. Muestra grande.

5.

Regiones crticas: Criterios de decisin.


La hiptesis alternante define las zonas de rechazo.
reas
Criterios
Si Zc < -1,64, Se rechaza H0
Si Zc -1,64 , No se rechaza H0

0.05

6.

Clculos:

7.

Conclusin:

p0.21
~ N (0, 1)
(0.21) (0.79)
700

El valor de la proporcin de 0.1714,


encontrado en la muestra se transforma a Z,
el cual nos da un valor de Zc=-2.505 que cae
en la regin de rechazo de la Ho.

0.95

-1.64

pp0

p0 (1 p0 )
n

120
p
0.1714
700

Zc

120
0.21
700
2.505
0.21(1 0.21)
700

Hay evidencia estadstica, al nivel de significacin del 5%, para afirmar que RRS sobre
estim el porcentaje de ventas de 21%. Por lo que estamos a favor de la sospecha del
gerente de SSR.
Estadstica Aplicada

Pgina 29

Ejercicio 12.
El administrador del restaurante FINO debe tomar varias decisiones (con =0.05):
Lanzar la promocin Coman 4 y Paguen 3 si la proporcin de mesas ocupadas con ms
de 3 personas es menor de 0.3. Se toma al azar 80 mesas y se encuentra que hay 22 mesas
ocupadas con ms de 3 personas. Se lanzar la promocin?

Estadstica Aplicada

Pgina 30

2.5. Uso del valor sig proporcionado por el SPSS en sus pruebas
El SPSS nos proporciona el sig (bilateral) que se obtiene con la informacin que nos
proporciona la muestra. Este valor es una probabilidad que sirve para comparar con el
nivel de significacin elegido por el investigador.
La forma correcta de usarlo para las pruebas de hiptesis de la media es la siguiente:
PRUEBA UNILATERAL DERECHA (Valor crtico Tcrtico positivo)
Valor de la estadstica de prueba
Tcal negativo

Comparacin con
No tomar en cuenta el valor de sig

Decisin
NRHo

Tcal positivo

(sig/2) <

RHo

Tcal positivo

(sig/2)

NRHo

Distribution Plot
T, df=19

0.05
0

Siendo: Tcal=T calculado=T estadstico

1.73

Tcrtico

PRUEBA UNILATERAL IZQUIERDA (Valor crtico T crtico negativo)


Valor de la estadstica de prueba
Tcal positivo

Comparacin con
No tomar en cuenta el valor de sig

Decisin
NRHo

Tcal negativo

(sig/2) <

RHo

Tcal negativo

(sig/2)

NRHo

PRUEBA BILATERAL (Dos valores crticos, uno positivo el otro negativo)


Comparacin con

Decisin

sig <

RHo

sig

NRHo

Estadstica Aplicada

Pgina 31

Ejercicios propuestos 2.
9. Bantam Books, una editorial muy famosa, decidir publicar un nuevo libro de cocina, si
logra probar, con un nivel de significacin del 2%, de que el precio promedio que estaran
dispuestos a pagar los clientes por libro es ms de US$ 35,00. Suponga que el precio de
los libros de cocina se distribuyen normalmente, esta afirmacin se sustenta si una
muestra de 25 libros de cocina tiene una media de US$ 37,97 y una desviacin estndar
de US$ 12,87? Asuma normalidad.
Rpta:
Tc=1.15. DE: No rechazar Ho.
10. La cantidad media de ingresos por familia en Lima es de S/. 2 900 soles. Luis Montes
planea abrir un concesionario de automviles y quiere verificar esa cifra para una Zona
especfica de Lima, ya que en el caso que el ingreso promedio familiar sea menor a S/.2
900 soles, Luis no abrira un concesionario en esa zona. Luis encuentra resultados de una
encuesta reciente de 25 familias que viven en la zona de estudio donde se indica que la
media es de S/. 2 100 soles con una desviacin estndar de S/. 823. Al nivel de
significacin del 5%, cul ser la decisin de Luis Montes?
11. Una escuela de negocios local afirma que sus estudiantes graduados obtienen en su
primer trabajo, un salario promedio diario tan igual como el salario nacional, el cual es de
20 soles la hora. Como usted no da crdito y piensa que el valor es exagerado, selecciona
una muestra aleatoria de 10 alumnos graduados del ltimo ao de la mencionada escuela
y encontr los siguientes salarios por hora en su primer trabajo:
16,50 ; 19,00 ; 22,00 ; 21,50 ; 21,00 ; 16,50 ; 17,00 ; 21,00 ; 21,50 ; 22,00
Al nivel de significacin del 5%, estos datos apoyan su creencia sobre la afirmacin de
que hace la escuela de negocios.
Rpta:
Tcal=-0,272
12. El fabricante de la motocicleta Ososki anuncia en una propaganda de televisin que su
vehculo rendir en promedio 87 millas por galn en viajes largos. Los millajes (recorrido
en millas) en ocho viajes prolongados fueron: 88, 82, 81, 87, 80, 78, 79, 89. Al nivel de
significacin del 5% el millaje medio es menor que el anunciado? Rpta: Tcal= -2,605
13. Un dentista lanzar su campaa de dientes sanos si el nmero promedio de pacientes
que atiende diariamente es menor que 22. Usando una muestra de nueve das
seleccionados aleatoriamente de los ltimos meses, se ha tenido las siguientes cantidades
de pacientes: 22, 25, 20, 18, 15, 22, 24, 19 y 26. Si la cantidad de pacientes atendidos por
da tiene una distribucin normal,
a) Decidir el dentista lanzar su campaa? Use un nivel de significacin del 5%.
Rpta:
Tcal=-0,655
b) Con estos datos, se estara a favor de que la varianza de la cantidad de pacientes
atendidos por da en los ltimos meses es superior a 10? Use un nivel de significacin
del 10%. Interprete el resultado.
Rpta: c 2=10.16, DE: No se rechazar Ho
14. En cierta universidad se estima que el 25% de los estudiantes van en bicicleta a la
universidad. Es posible refutar esta estimacin, si en una muestra aleatoria de 90
estudiantes universitarios, se encuentra que 32 van en bicicleta a la universidad? Utilice
un nivel de significancia de 0,06.
Rpta:
Zc=2.31, DE: Rechazar Ho
15. En una encuesta aleatoria de 1000 hogares realizada en Lima, se encontr que 9% de los
hogares tena al menos un miembro con educacin superior. Este resultado valida la
aseveracin que en los hogares de Lima es menos de 12%?. Use un nivel de 0,05 de
significacin.
Rpta:
Zc= - 2.92, DE: Rechazar Ho
Estadstica Aplicada

Pgina 32

16. La Comisin de Defensa del Consumidor - CDC, realiza peridicamente estudios


estadsticos con el fin de comprobar las afirmaciones de los fabricantes acerca de sus
productos. Por ejemplo, la etiqueta de la lata grande de Enigma Coffee dice que contiene
800 gramos de caf. La CDC sabe que el proceso de Enigma Coffe no permite llenar las
latas exactamente con 800 gramos de caf por lata. Sin embargo, mientras la media
poblacional del peso de llenado sea por lo menos 800 gramos, los derechos del
consumidor estarn protegidos. Por esta razn, la CDC interpreta que la informacin de la
etiqueta de la lata grande tiene una media poblacional de por lo menos 800 gramos de
caf. De un lote de 2000 latas grandes de Enigma Coffee, un equipo de CDC selecciona
una muestra de 36 latas y registra el peso de caf que contiene cada una de ellas,
obteniendo un peso promedio es de 793 gramos y una desviacin estndar de 24 gramos.
Utilizando un nivel de significancia del 5%, indique si para el lote indicado, los derechos
de los consumidores de Enigma Coffee no estn protegidos.
Rpta:
t cal = -1,7655, RHo, derechos no estn protegidos
17. El seor Standard Deviation gana un premio de lotera y decide invertir en acciones de la
empresa Enigma Comunicaciones S.A. Sin embargo, est preocupado ante el riesgo que
presentan estas acciones medido a travs de la varianza de su cotizacin. Sabe que las
ltimas cotizaciones diarias por accin (en nuevos soles) han sido las siguientes:
5,93
15,48
12,4
17,62 15,64
14,85
13,85 18,78
17,78
16,99
12,19 18,23 16,66
15,1
13,46
El Sr. Deviation considera aceptable una desviacin estndar menor a 3 nuevos soles.
Suponiendo normalidad en las cotizaciones diarias y utilizando un nivel de significancia
del 10%, debera invertir el Sr. Deviation en acciones de la empresa Enigma
Comunicaciones S.A?
Rpta:
X2cal = 16,36, NRHo, no deber invertir
18. Con el fin de satisfacer las necesidades de los empleados, se tom una encuesta a 75 de
un total de 850 empleados, sobre la modalidad que prefieren al tomar sus das de
vacaciones: fraccionada o completa. Los resultados obtenidos fueron:
Modalidad
Completa
Fraccionada
Indistinto
Total

Cantidad de empleados
36
25
14
75

Pruebe a un nivel de significancia del 4% si la proporcin de todos los empleados de la


empresa que prefieren tomar sus das de vacaciones en la modalidad completa es menor
al 49%. De ser as, la empresa deber hacer cambios en su poltica de vacaciones. Ser
necesario hacer dichos cambios.
Rpta:
Zcal = -0,1813, RHo, deber hacer cambios en su poltica de vacaciones
19. Una empresa agro-exportadora afirma que su produccin de
mangos de Chulucanas-Piura, posee en promedio ms de 13,7
gramos de fructuosa por mango, lo que indica ndices superiores de
dulzura de esta fruta. Esto le permite obtener mejores precios en el
mercado internacional. Para verificar lo afirmado su mejor cliente
USA FRUIT extrae una muestra y obtiene lo siguiente:
Muestra
1
2
3
4
5
6
7
8
9
10
Fructuosa 13,50 13,30 14,20 15,10 14,40 14,10 13,90 13,80 15,40 14,60
Realice la prueba de hiptesis adecuada con un alfa=0,05
Rpta:
Se Rho. Se podr obtener mejores precios en el mercado internacional.
Estadstica Aplicada

Pgina 33

2.6. Pruebas de hiptesis para dos varianzas poblacionales


Ejemplo 6.
Diecisis latas de CROC Aid presentan un contenido promedio de 17,2 onzas, con una
desviacin estndar de 3,2 onzas, y trece latas de Energy Pro producen un contenido promedio
de 18,1 onzas y S = 2,7 onzas. Asumiendo distribuciones normales, Se puede afirmar, con
5% de significacin, que hay diferencia en la variabilidad de los contenidos de las dos marcas
de gaseosas?

Solucin:

Sean X1: Contenido de una lata de gaseosa CROC Aid (onzas) X 1 ~ N( 1 , 12 )


1.

X2: Contenido de una lata de gaseosa Energy Pro (onzas) X 2 ~ N( 2 , 22 )


Planteo de hiptesis:

21
2
2

1
H
:

2
0 1
22

2
H : 2 2 1 1
1
1
2
22

2.

Nivel de significacin: 0,05

3.

Estadstica de prueba:
S 2 2 S 2
F 12 22 12 ~
S 2 1 S2

f (15,

Las varianzas son homogneas.


Las varianzas son heterogneas.

Se supone que Ho es verdadera.

12)

4.

Supuestos:

5.

a.
Poblaciones normales.
b.
Muestras independientes y extradas al azar
Regiones crticas y criterios de decisin:
Criterios
Si 0,338 Fc 3,18

No se rechaza H0

Si Fc < 0.338 o Fc > 3,18

Se rechaza H0

reas
6.

Clculos:
Fc

(3, 2) 2
(2, 7) 2

1, 405

El Fc est en la zona de No rechazo de la Ho

7. Conclusin: Con 5% de nivel de significancia, la informacin muestral no fue suficiente


para concluir que exista diferencia en las variabilidades de los contenidos de las latas de
gaseosas de ambas marcas. Luego podemos decir que las varianzas son HOMOGNEAS.

Estadstica Aplicada

Pgina 34

Ejercicio 13.
Una agencia de seguros local desea comparar los gastos medios ocasionados por daos en
accidentes similares en dos modelos de automviles. Nueve ejemplares del primer modelo y
siete del segundo modelo son sometidos a una colisin controlada obteniendo los siguientes
gastos, en dlares, por daos sufridos:
Colisin
Modelo 1
Modelo 2

1
345
340

2
310
325

3
305
345

4
345
310

5
355
315

6
375
280

7
320
290

8
310

9
305

Con un nivel de significacin del 5%, se puede afirmar que la variabilidad de los gastos
ocasionados por la colisin con el modelo 1 es similar a generados por el modelo 2? Suponga
que los gastos por daos en ambos modelos de automviles siguen una distribucin normal.

Estadstica Aplicada

Pgina 35

2.7. Pruebas de hiptesis para dos medias poblacionales (1 y 2)


Caso 1: Muestras independientes, varianzas poblacionales desconocidas
y homogneas
Ejemplo 7.
Tomando en cuenta el ejemplo anterior, con 5% de significacin, se puede afirmar que, el
contenido promedio de las latas de CROC Aid es diferente que el de las latas de Energy Pro?

Solucin:

Sean X1: Contenido de una lata de gaseosa CROC Aid (onzas) X 1 ~ N( 1 , 2 )


X2: Contenido de una lata de gaseosa Energy Pro (onzas) X 2 ~ N( 2 , 2 )
1.

Planteo de hiptesis.
H 0 : 1 2 1 2 0

H1 : 1 2 1 2 0

2.
Nivel de significacin.
3.
Estadstica de prueba:
Suponiendo que Ho es verdadera
t

( x1 x2 ) ( 1 2 )

1
2 1
S p
n1 n2

( x1 x2 )

0,05

1
1
S p2
n1 n2

t~

( n1 n2 2)

2
2
donde: S2p (n1 1)s1 (n 2 1)s2

n1 n 2 2

Varianza muestral ponderada

4.
a.
5.

Supuestos:
Poblaciones normales. b. Muestras independientes y tomadas al azar.
Regiones crticas y criterios de decisin:
reas
Criterios
Si -2,048 tc 2,048 No se rechaza H0
Si tc < -2,048 o tc > 2,048 se rechaza H0

6.
tc

7.

Clculos:

(17,2 18,1) (0)

0,815
1 1
8,976
17 13

El valor de tc est en la zona de aceptacin.

Conclusiones:
Con 5% de nivel de significacin la diferencia encontrada en las muestras no es
significativa, luego no hay diferencia en los contenidos promedio de las latas de las dos
marcas de gaseosas.

Estadstica Aplicada

Pgina 36

Ejercicio 14.
Una agencia de seguros local desea comparar los gastos medios ocasionados por daos en
accidentes similares en dos modelos de automviles. Nueve ejemplares del primer modelo y
siete del segundo modelo son sometidos a una colisin controlada obteniendo los siguientes
gastos, en dlares, por daos sufridos:
Colisin
Modelo 1
Modelo 2

1
345
340

2
310
325

3
305
345

4
345
310

5
355
315

6
375
280

7
320
290

8
310

9
305

Si se supone que los gastos por daos en ambos modelos de automviles siguen una
distribucin normal, a un nivel de significacin del 5%, existe alguna diferencia en el gasto
medio ocasionado por las colisiones de cada modelo de auto?

Estadstica Aplicada

Pgina 37

Caso 2: Muestras independientes, varianzas poblacionales desconocidas


y heterogneas
Ejemplo 8.
Diecisis latas de CROC Aid presentan una media de 17,2 onzas, con una desviacin estndar
de 3,2 onzas, y 13 latas de Energy Pro producen una media de 18,1 onzas y S = 1,1 onzas. Se
puede afirmar con 5% de significacin que las latas de las dos marcas de gaseosas tienen
contenidos promedios diferentes?

Solucin.

Sean X1: Contenido de una lata de gaseosa CROC Aid (onzas) X1 ~ N( 1 , 12 )


X2: Contenido de una lata de gaseosa Energy Pro (onzas) X2 ~ N( 2 , 22 )
Debe probarse primero si las varianzas de las poblaciones de las cuales provienen las
muestras son homogneas o heterogneas.
1. Planteo de hiptesis:

2. Nivel de significacin:

0,05

3. Estadstica de prueba:
2

4.
a.
5.

Supuestos:
Poblaciones normales. b. Muestras independientes y tomadas al azar.
Regiones crticas y criterios de decisin:
Criterios
Si 0,338 Fc 3,18

No se rechaza H0

Si Fc < 0.338 o Fc > 3,18

Se rechaza H0

reas
6.

Clculos:
Fc

7.

(3, 2) 2
8, 46
(1,1) 2

Conclusiones:
Con 5% de nivel de significacin la informacin muestral nos estara indicando que las
varianzas no son HOMOGNEAS, o que las varianzas son HETEROGNEAS.

Estadstica Aplicada

Pgina 38

Luego de probar que las varianzas no son homogneas, realizaremos la


prueba de hiptesis para la diferencia de medias.
1.

Planteo de hiptesis:
H 0 : 1 2 1 2 0

H1 : 1 2 1 2 0

2.

Nivel de significacin: 0,05

3.

Estadstica de prueba:

4.

Supuestos:

a. Poblaciones normales. b. Muestras independientes y tomadas al azar.


5.

Regiones crticas. Criterios de decisin.

Antes de hallar las regiones se debe determinar el valor de v:

2 2
2
3,2 1,1
17
13
v
20,66 21
3,2 2

17

1,1 2

13

17 1 13 1

reas

Criterios
Si -2,08 tc 2,08,

No se rechaza H0

Si tc < -2,08 o tc > 2,08, Se rechaza H0

El valor de tc cae en la zona de aceptacin de la Ho.

6.

Clculos
tc

7.

(17,2 18,1) (0)


3,2 2 1,12

13
17

1,079

Conclusiones.
Con 5% de nivel de significacin no encontramos diferencias en los contenidos
promedios que tienen las latas de las dos marcas de gaseosas.

Estadstica Aplicada

Pgina 39

Ejercicio 15.
Se ha llevado a cabo un estudio para analizar los gastos mensuales en seguro mdico
realizados por las empresas comerciales de dos ciudades. Para ello, se tom una muestra
aleatoria de 16 empresas en cada ciudad encontrndose los siguientes resultados en relacin al
gasto en seguro (en cientos de dlares):
Ciudad A
Ciudad B
Asumiendo que el gasto mensual en seguro tiene distribucin
normal. Se puede concluir que los gastos en seguro que n
16
16
realizan las empresas comerciales de la ciudad A superan a las
Media
86,875 83,3688
de la ciudad B en ms de 50 dlares? Utilice un nivel de
significacin del 10%.
S
324,1553 61,5250

Estadstica Aplicada

Pgina 40

Caso 3: Muestras relacionadas


Ejemplo 9.
Dona Rose es supervisora de produccin de la lnea de ensamblado de unidades de disco de
computadoras de Winchester Technologies (WT). Recientemente, WT instal un sistema de
audio para msica ambiental en sus instalaciones, a sugerencia de Dona que afirma que la
msica relajar a sus obreros y mejorarn la produccin diaria en ms de 2 unidades. Para
probar su afirmacin, muestre la produccin semanal de los mismos seis trabajadores antes
de tener msica ambiental y despus de haberse instalado el sistema. Los datos que obtuvo se
presentan la siguiente tabla. A un nivel = 0,05, la msica ambiental logr aumentar la
produccin promedio diaria en ms de 2 unidades como lo afirma Dona? Suponga que la
distribucin de las diferencias de produccin diaria antes y despus de colocar el sistema con
la msica es aproximadamente normal.
Produccin diaria de los empleados
1
2
3
4
5
6
Semana sin msica
Semana con msica
Diferencias = d = X2 - X1

219
235
16

203
200
-3

226
240
14

198
210
12

209
223
14

216
217
1

Solucin:
Sean X1: Produccin diaria por empleado cuando trabaja sin msica.
X2: Produccin diaria por empleado cuando trabaja con msica.
d = X2 - X1
1. Planteo de hiptesis:
H 0 : 2 1 2

H1 : 2 1 2

H 0 : D 2

H1 : D 2

2. Nivel de significacin: 0,05


d 2
~ tn1
3. Estadstica de prueba: t
Sd / n
4. Supuestos:
Las diferencias tienen distribucin normal.
5. Regiones crticas y criterios de decisin.
La hiptesis alternante define la(s) zona(s) de rechazo.
Si -2,015 tc 2,015, No se rechaza H0

Distribution Plot
T, df=5
0.4

Si tc < -2,015 o tc > 2,015,

0.3

0.2

(16 3 14 12 14 1)
9
6

(16 9) 2 (3 9) 2 ... (1 9) 2
7.9498
5
7. Conclusiones.
Como el valor de tc cae en la regin de Rechazo
de la Ho, se RHo. Con 5% de nivel de
significacin la informacin recogida nos
proporciona evidencia estadstica suficiente para
concluir que la msica ambiental logr aumentar
la produccin promedio diaria en ms de 2
unidades.
Sd

0.1

0.05
0.0

6. Clculos:
tc

Se rechaza H0

9 2
7.9498/

Estadstica Aplicada

2.16

2.02

Pgina 41

Ejercicio 16.
Una empresa desea implementar la meditacin trascendental MT siempre que pruebe que sta
logra un aumento significativo en la escala compuesta sobre comportamientos de liderazgo en
los empleados de su empresa la cual toma valores de 0 a 20 donde 20 significa un alto grado
de liderazgo. Para realizar el estudio selecciona al azar a 10 empleados y registra los valores
obtenidos antes de entrar al programa de MT y despus de cuatro meses de MT. Los
resultados se muestra en la siguiente tabla.
Empleado
1
2
3
4
5
6
7
8
9
10

Despus de MT
17
14
16
13
8
18
8
16
12
11

Antes de MT
14
13
14
8
9
12
10
13
10
9

Si consideramos que el valor que registran en la escala los empleados de la empresa sigue una
distribucin normal, los resultados de este estudio proporcionan a la empresa suficiente
evidencia para tomar la decisin de que debe implementar la meditacin trascendental como
poltica puesto que aumentar la escala compuesta sobre comportamiento de liderazgo en sus
empleados? Use un nivel de significancia del 5%

Estadstica Aplicada

Pgina 42

2.8. Prueba de hiptesis para dos proporciones (p1 y p2)


Ejemplo 10.
En una prueba de calidad de dos comerciales de televisin se pas cada uno en un rea de
prueba seis veces durante un perodo de una semana. La semana siguiente se llev a cabo una
encuesta telefnica para identificar a las personas que haban visto esos comerciales. A las
personas que los vieron se les pidi definieran el principal mensaje en ellos. Se obtuvieron los
siguientes resultados:
Comercial

Personas que lo
vieron

Personas que recordaron el


mensaje principal

150

63

200

60

Al nivel de significacin del 5%, existen diferencias significativas en la proporcin de


personas que recordaron el mensaje principal de los dos comerciales?

Solucin.
Sea p1: Proporcin de personas que recordaron el mensaje principal del comercial A.
Sea p2: Proporcin de personas que recordaron el mensaje principal del comercial B.
1. Planteo de hiptesis.
H 0 : p1 p 2

H1 : p1 p 2

2. Nivel de significacin.
0.05
3. Estadstica de prueba.
Z

p 1 p 2
1 1
p(1 p)
n1 n2

p 1
~ N (0, 1)

x1
;
n1

p 2

x2
n2

x x
n p n p
~
p 1 2 1 1 2 2
n1 n2
n1 n2

4. Supuestos.
b) Muestra tomada al azar. b. Muestras grandes.
5. Regiones crticas. Criterios de decisin.
La hiptesis alternante define la(s) zona(s) de rechazo.
reas

Criterios
Si -1,96 Zc 1,96 No se rechaza H0
Si Zc < -1,96 o Zc > 1,96 Se rechaza H0

Zcal=2,328

Estadstica Aplicada

Pgina 43

6. Clculos
63 6 0
~
p
0.351
150 200

Zc

63
60

150 200
2,328
1
1
(0.351)(0.649 )

150 200

7. Conclusin:
Con 5% de nivel de significacin y a partir de la informacin muestral, hay diferencias
significativas en las proporciones que recuerdan los dos comerciales.
Ejercicio 17.
En una encuesta se pregunt a 1 035 adultos sobre su percepcin respecto a la participacin
de las compaas estadounidenses en la economa global. 704 de los encuestados
respondieron bien o excelente. En una encuesta similar, realizada cuatro aos despus, 782
de 1 004 adultos encuestados respondieron a la misma pregunta como bien o excelente. Con
los resultados muestrales,
a) se puede concluir que la proporcin de adultos que respondieron bien o excelente se
increment en los ltimos cuatro aos? Use un nivel de significacin del 1%.

b) se puede concluir que la proporcin de adultos que respondieron bien o excelente se


increment en los ltimos cuatro aos en ms de 5%? Use =0.05.

Estadstica Aplicada

Pgina 44

Ejercicios propuestos 3.
20. Un investigador desea verificar si existe evidencia de una diferencia en la resistencia
media entre dos tipos de material para embalaje. La descripcin de las lecturas en pielibra de la resistencia al impacto de los dos tipos de embalaje se muestra en la tabla:
Caractersticas
Embalaje A Embalaje B
Media
1,2367
0,9778
Varianza
0,0042
0,0024
Observaciones
9
9
a) Cul es la hiptesis planteada?, es una hiptesis unilateral o bilateral?
b) A partir de los datos obtenidos compruebe la hiptesis y concluya con 2% de nivel de
significacin. Asuma poblaciones normales.
Rpta:
Para la prueba de homogeneidad
Fc=1.75.
DE: Hay homogeneidad de varianzas.
Para la prueba de diferencia de medias
Tc= 9.56 GL:16.
DE: Rechazar Ho.
21. Dos encuestas independientes sobre salarios, realizados en dos reas metropolitanas muy
distintas entre s, revelaron la siguiente informacin con respecto a los sueldos promedios
de los operadores de equipo pesado.
rea
A
B
Media
$6,50 / h.
$7,00 / h.
Desviacin Estndar
$4,50 /h.
$ 2,00 / h.
Tamao de la muestra
16
13
Suponga que los datos provienen de poblaciones normales. Se puede concluir que los
sueldos promedios son diferentes con un =0.05
22. La compaa distribuidora Allen tiene la hiptesis de que una llamada telefnica es ms
efectiva que una carta para acelerar el pago de cuentas atrasadas. Se contactaron dos
grupos de cuentahabientes atrasados, cada uno con uno de los dos mtodos, y se registr
el lapso entre l envi de la carta o la llamada y el momento en que se registr el pago.
Mtodo utilizado
Das hasta el pago
Carta

10

Llamada telefnica 7

11

11

14

10

Al nivel de = 0,05, debera Allen llegar a la conclusin de la llamada es ms efectiva


que la carta para el pago de las cuentas atrasadas?
23. Un patrocinador de un programa especial de televisin afirma que el programa representa
un atractivo mayor para los televidentes hombres que para las mujeres. Si una muestra
aleatoria de 300 hombres y otra de 400 mujeres revel que 120 hombres y 120 mujeres
estaban viendo el programa especial de televisin. Al nivel de significacin del 5%, se
podra decir que el patrocinador tiene la razn?
Rpta: Zc=2.76 DE: Rechazar Ho.
24. Se llev a cabo una encuesta entre los miembros del Club del libro del mes, para
determinar si pasan ms tiempo viendo televisin que leyendo. Suponga que en una
muestra de 12 encuestados se obtuvieron las horas semanales que se dedican a ver
televisin y las que se dedican a la lectura. Con un nivel de significacin del 5%, se

Estadstica Aplicada

Pgina 45

puede llegar a la conclusin de que los miembros del club del libro del mes pasan ms
tiempo, en promedio, viendo televisin que leyendo? Asuma Normalidad.
Encuestado 1 2 3 4 5 6 7 8 9 10 11 12
Televisin 11 19 8 5 16 8 4 12 10 14 15 18
Leyendo

6 10 3 10 5 8 7 14 14 8 10 10

25. Se realiza un estudio en la North Central University para medir el efecto del cambio
ambiental en estudiantes extranjeros. Uno de los aspectos del estudio es una comparacin
del peso de los alumnos al ingresar a esa universidad, con su peso un ao ms tarde. Se
sospecha que el tipo de alimento provoca un aumento de peso. Se tom una muestra de
estudiantes y los datos se dan a continuacin.
Nombre
Nassar
OToole
Oble
Silverman
Kim
Gross

Peso al llegar
124
157
98
190
103
135

Peso un ao despus
142
157
96
212
116
134

Con 5% de significacin, el tipo de alimentacin provoca en los estudiantes extranjeros


un aumento de peso?
Rpta: Tc=-1.92 DE:No rechazar Ho.
26. Se cree que la portada y la naturaleza de la primera pregunta de encuestas por correo
influyen en la tasa de respuesta. El artculo The Impact of Cover Design and First
Questions on Response Rates for a Mail Survey of Skydivers (Leisure Sciences, 1991,
pp. 67-76) prob esta teora al experimentar con diferentes diseos de portadas. Una
portada era sencilla; la otra utiliz la figura de un paracaidista. Los investigadores
especularon que la tasa de devolucin sera menor para la portada sencilla.

Portada
Sencilla
Paracaidista

Nmero
enviado
207
213

Nmero
devuelto
104
109

Apoya esta informacin la hiptesis de los investigadores? Pruebe las hiptesis


pertinentes usando un nivel de significacin del 5%.
Rpta: Zc= - 0.19 DE: No rechazar Ho.
27. El empleo de equipo de cmputo en las empresas est creciendo con una rapidez
vertiginosa. Un estudio reciente, en la que participaron 15 empresas del sector industrial,
revel que 184 de 616 adultos trabajan utilizando con regularidad una computadora
personal, una microcomputadora, un terminal de computadora o un procesador de texto
en su trabajo. Se seleccion otra muestra de 450 adultos, de 10 empresas del sector salud,
en la muestra se obtuvo que 105 adultos utilizan con regularidad una computadora
persona, una microcomputadora, un terminal de computadora o un procesador de texto en
su trabajo Existe diferencias significativas entre los porcentajes de adultos, de las
empresas del sector industria y de salud, que utilizan algn equipo de cmputo en su
trabajo? Use un nivel de significacin del 5%.
Rpta: Zc=2.40
DE: Rechazar Ho.
28. El administrador de un prestigioso centro de Belleza, afirma que su tratamiento brasilero
para acelerar el crecimiento de cabello logra al cabo del periodo de un mes incrementos
Estadstica Aplicada

Pgina 46

mayores a 4 centmetros de longitud. La siguiente tabla muestra el largo del cabello de 12


clientas que siguieron dicho tratamiento:
Cliente

10

11

12

Inicio del tratamiento

10

31

21

35

27

37

26

23

40

36

28

21

Fin del tratamiento

14

36

22

36

32

39

29

29

42

42

35

29

El administrador desea saber si el tratamiento capilar es efectivo en aumentar la longitud


del cabello en ms de 4 centmetros en un mes. Utilice = 0,05
Rpta: Tcal = 0,2439 , NRHo, Tratamiento no es efectivo
29. Hoy en da los bancos compiten por poseer las cuentas sueldo de los trabajadores
dependientes. Los bancos Ay B, lideran la participacin de mercado en lo que a cuentas
sueldo se refiere. Ambos bancos ofrecen incentivos tales como: puntos, descuentos y tasa
preferenciales. El gerente de recursos humanos de una empresa que solo trabaja con los
bancos A y B en Lima afirma que en su empresa, la proporcin de trabajadores con sede
en Lima que eligieron el banco A para su cuenta sueldo es mayor que la proporcin de
trabajadores con sede en provincia que eligieron su cuenta sueldo en el banco A. Tiene
razn en lo que afirma? Use Alfa = 0.05.

Rpta:

Trabajadores
sede Lima

Trabajadores sede
Provincias

Muestra

1000

600

Banco A

600

330

Zcal= 0.66

No Rho. El gerente de RRHH no tiene razn en lo que afirma.

30. Mantener el peso ideal es una preocupacin, que las empresas han identificado como una
interesante oportunidad de negocio. Fine es una empresa dedicada a ayudar a alcanzar el
peso ideal; garantiza que en 23 sesiones sus clientes pierden ms de 5 kilogramos. Para
comprobar lo ofrecido en su garanta, Indecopi selecciona una muestra aleatoria de 16
pacientes y obtuvo los siguientes resultados (en kilos):
79 71 83 86 78 79 88 89 85 76 70 78 69 89 75 90
Inicio
23
sesiones
despus

71

64

75

80

70

72

85

81

72

70

71

70

63

83

68

82

Con alfa=0.05; se cumple lo ofrecido por Fine?


Rpta: T=2.55 Rho. Podemos afirmar que en 23 sesiones sus clientes pierden ms de 5
kilogramo; es decir que si se cumple lo ofrecido por Fine.

Estadstica Aplicada

Pgina 47

Unidad 3 Prueba de Independencia y


Homogeneidad de Subpoblaciones
3.1. Prueba de Independencia
Estamos interesados en ver la relacin existente entre dos variables categricas de una misma
poblacin.
Las variables cualitativas o categricas son aquellas variables cuyos valores son del tipo
categrico, es decir; que indican categoras o son etiquetadas numricamente o con nombres.
Son las que se refieren a clasificaciones, como: estado civil, profesin, color de los ojos,
preferencia por una marca etc., es decir, son aquellas que no aparecen en forma numrica,
sino como categoras o atributos. Esta a su vez, se clasifica en:
Variables Categricas Nominales: Son las variables categricas que, adems de que
sus posibles valores son mutuamente excluyentes entre s, no tienen alguna forma
natural de ordenacin. Por ejemplo, cuando sus posibles valores son: S y No. A
este tipo de variable le corresponde las escalas de medicin nominal.
Variables Categricas Ordinales: Son las variables categricas que tienen algn
orden. Por ejemplo, cuando sus posibles valores son: siempre, casi siempre y
nunca. A estos tipos de variables le corresponden las escalas de medicin ordinal.
La pregunta que el investigador desea contestar podran ser
Existe relacin entre hacer deporte y depresin en los jvenes?
Existe relacin entre la gravedad de un accidente y gnero
Existe relacin entre Motivo del prstamo y grupo de edad?
Procedimiento
Cada individuo de la poblacin en estudio se puede clasificar segn dos criterios A y B.
Suponga que la primera variable permite clasificar a cada observacin en una de r categoras
y que la segunda variable permite clasificar a cada observacin en una de c categoras. A la
tabla que muestra ambas variables y las frecuencias observadas en cada una de las r c
categoras resultantes se le conoce como tabla de contingencia r c .
Columna 1

Variable
X

Variable Y
Columna 2

...

Columna c

Total

Fila 1

O11

O12

O1c

O1

Fila 2

O21

O22

O2 c

O2

.
.
.
Fila r

.
.
.

.
.
.

.
.
.

.
.
.

Or1

Or 2

...

Orc

Or

O1

O 2

...

O c

Total

Esta prueba es especialmente til cuando se trata de analizar la independencia entre dos
variables en escala nominal. Cuando las variables estn en escala ordinal, intervalo o
Estadstica Aplicada

Pgina 48

razn, existen otros procedimientos ms adecuados, como por ejemplo mediante el clculo
de coeficientes de correlacin (en un captulo posterior se ver el caso del coeficiente de
correlacin de Pearson, til para analizar asociacin lineal entre dos variables
cuantitativas).
La frecuencia esperada correspondiente en cada una de las rc celdas est dada por la
expresin:
Frecuencia esperada = eij

OiO j
n

total de fila i total de columna j


Gran total

Pasos para realizar la Prueba de Hiptesis


1) Formulacin de la Hiptesis
Ho: X e Y son independientes (X e Y no estn relacionadas)
H1 : X e Y no son independientes (X e Y estn relacionadas)

2) Fijacin del nivel de significacin:

3) Estadstica de prueba: La estadstica para la prueba de independencia es la variable


Chi-cuadrado con grados de libertad
k

2
cal

i1

(oi ei ) 2
~ 2 con (r 1)(c 1) grados de libertad
ei

4) reas y criterio de decisin:


Criterio:
2
2
Si cal
se rechaza la Ho
crtico
2
2
no se rechaza la Ho
Si cal
Crtico

5) Clculos previos

(oi ei ) 2 (o1 e1 ) 2 (o2 e2 ) 2

ei
e1
e2
i1
k

2
cal

(ok ek ) 2

ek

6) Conclusin
Se derivan de la decisin estadstica y de las variables especificas concerniente al
problema que se encuentra en evaluacin.

Estadstica Aplicada

Pgina 49

Ejemplo 11.
Para determinar si existe una relacin entre la calificacin de un empleado en el programa de
capacitacin y su rendimiento real en el trabajo, se tom una muestra de 400 casos de los
archivos y se obtuvo las frecuencias observadas que se presentan en la siguiente tabla de
contingencia 33.
Rendimiento real en
el trabajo
(calificacin del
empleador)

Calificacin en el programa de
capacitacin

Total

Debajo del
promedio

Promedio

Sobre el
promedio

Deficiente

23

60

29

112

Promedio

28

79

60

167

49

63

121

60

188

152

400

Muy bueno
Total

Con el nivel de significacin 0,01, La calificacin del rendimiento del trabajador est
asociada con la calificacin en el programa de capacitacin?

Solucin
Las variables que se muestran en la tabla son:
Variable 1: Calificacin del rendimiento real en el trabajo, con tres categoras: Deficiente,
promedio y muy bueno.
Variable 2: Calificacin en el programa de entrenamiento, con tres categoras: Debajo del
promedio, promedio o sobre el promedio.
La prueba de independencia compara las frecuencias observadas frente a las frecuencias
esperadas bajo el supuesto de que ambas variables sean independientes.
La siguiente tabla muestra tanto las frecuencias observadas como las esperadas (entre
parntesis)
Rendimiento real en
el trabajo
(calificacin del
empleador)
Deficiente

Calificacin en el programa de
capacitacin
Debajo del
Sobre el
Promedio
promedio
promedio
23 (16,80) 60 (52,64) 29 (42,56)

Promedio

28 (25,05)

79 (78,49)

60 (63,46)

167

Muy bueno

9 (18,15)

49 (56,87)

63 (45,98)

121

60

188

152

400

Total

Estadstica Aplicada

Total

112

Pgina 50

Pasos para realizar la prueba de independencia


1)

Formulacin de las hiptesis


H0: La calificacin del rendimiento real de un empleado en el trabajo no est
relacionado (es independiente) con la calificacin en el programa de capacitacin.
H1: La calificacin del rendimiento real de un empleado en el trabajo est relacionado
(no es independiente) con la calificacin en el programa de capacitacin.

2)

Fijacin del nivel de significacin: 0,01.


.

3)

reas y criterio de decisin: (3 1)(3 1) 4 g. l.

Criterio:
2
Si cal
> 13,277 se rechaza H0,
2
13,277 no se rechaza H0.
Si Cal

4)

Clculos previos
(23 16,80) 2 (28 2 5,05)2
(63 4 5,98)2
2
...
20,18

Cal

25,05
45,98
16,80

5)

Conclusin: Con nivel de significacin 0,01 se rechaza la hiptesis nula. Por lo tanto
hay evidencia estadstica suficiente para aceptar que la calificacin del rendimiento
real de un empleado en el trabajo est relacionado con la calificacin en el programa
de entrenamiento.

Salida SPSS:

Tab la de con tinge ncia Rend imien to * Aprovecham iento

Pruebas de chi-cuadra do

Rec uento
Aprovechamiento
Debajo del
Promedio
Rendimiento Deficient e
23
Muy Bueno
9
Promedio
28
Tot al
60

Estadstica Aplicada

Promedio
60
49
79
188

Sobre el
Promedio
29
63
60
152

Tot al
112
121
167
400

Chi-cuadrado de Pearson
Razn de verosimili tudes
N de cas os vlidos

Valor
20. 179a
20. 892
400

gl
4
4

Sig. asinttica
(bil ateral )
.000
.000

a. 0 c asillas (.0% ) tienen una frec uenc ia esperada inferior a 5.


La frecuencia mnim a esperada es 16.80.

Pgina 51

Ejercicio 18.
El consejo de administracin de Comunicatel desea conocer si la opinin, Y, de sus
accionistas respecto a una posible fusin es independiente del nmero de acciones, X, que
poseen. Una muestra de 500 accionistas proporciona la siguiente tabla:

Opinin respecto a una posible fusin


Nmero de
acciones
A favor
En contra
Indecisos
Menos de 200
25
18
21
De 200 a 1000
93
62
67
Ms de 1000
82
70
62
Total
200
150
150
Contraste la hiptesis respectiva con un nivel de significacin del 4,5%.

Total
64
222
214
500

3.2. Prueba de Homogeneidad de Proporciones


Esta prueba permite analizar si la distribucin de probabilidades de una variable categrica
es la misma en r poblaciones, es decir se busca determinar si dos o ms muestras
independientes provienen de una misma poblacin.
Como en el mtodo anterior, para esta prueba los datos muestrales se registran en r c
celdas de una tabla de contingencia de orden r c .
La hiptesis nula y alternativa es respectivamente:
Ho: Las k poblaciones son homogneas con respecto a la variable categrica.
H1: Las k poblaciones no son homogneas con respecto a la variable categrica.

El proceso de esta prueba de hiptesis es el mismo de la prueba de independencia.


Estadstica Aplicada

Pgina 52

Ejemplo 12.
En un estudio reciente, al personal de ventas de una compaa de computacin se le
pregunt si sus ventas se veran acrecentadas por una reduccin en el precio de las
computadoras o por una mejora en la calidad del servicio que se ofrece a los usuarios. Se
tomaron muestras al azar de vendedores de cada uno de los tres territorios de ventas, con
los siguientes resultados:
Norte

Sur

Este

Total

Menor precio

41

27

22

90

Mejor servicio

79

53

78

210

Total

120

80

100

300

Use un nivel de significacin de 0,05 para probar si hay homogeneidad en las tres reas
geogrficas con respecto a la opinin de los vendedores sobre los motivos del crecimiento
de sus ventas.
Pasos para realizar la prueba de homogeneidad de proporciones
1.

Formulacin de las hiptesis

H0: Hay homogeneidad en las tres reas geogrficas con respecto a la opinin de los
vendedores sobre los motivos del crecimiento de sus ventas.
H1: No hay homogeneidad en las tres reas geogrficas con respecto a la opinin de los
vendedores sobre los motivos del crecimiento de sus ventas.
Fijacin del nivel de significacin: 0,05.
2
k

3.
Estadstico
de
prueba:

4. reas y criterios de decisin.:


(2 1)(3 1) 2 g. l.
Criterios:
2
2
5,991 no se
> 5,991 se rechaza H0
Si Cal
Si Cal
rechaza H0
2.

5.

Clculos previos

Desintegrados
Permanecieron intactos
Total

2
Cal

Material A
41 (36)

Material B
27 (24)

Material C
22 (30)

Total
90

79 (84)
120

53 (56)
80

78 (70)
100

210
300

(79 8 4) 2
(78 7 0) 2
(413 6) 2

...

4,575

36
84
70

Con nivel de significacin de 0,05 no se rechaza la hiptesis nula; los datos son
insuficientes para rechazar que hay homogeneidad en las tres reas geogrficas con
respecto a la opinin de los vendedores sobre los motivos del crecimiento de sus ventas.

Estadstica Aplicada

Pgina 53

Ejercicio 19.
Actualmente existen organismos reguladores y supervisores de los diversos servicios que se
brindan a la comunidad. Tambin tenemos entidades que velan por el bienestar y los
derechos del consumidor. Es as que las propias empresas estn cada vez ms preocupadas
por brindar servicios de calidad.
La gerencia Sur de la empresa de Agua y Alcantarillado desea investigar si existe relacin
entre el distrito donde vive el usuario y la percepcin de calidad del servicio brindado.
Considere un Nivel de Significacin del 5%.
Con esta finalidad se extrae una muestra aleatoria de 500 usuarios y se obtuvo lo siguiente:

Percepcion
de Calidad
del Servicio

Bueno
Regular
Malo
Total

Miraflores
48
24
13
85

Distrito de Residencia
Surco
SJM
VM
42
35
12
38
33
40
18
32
33
98
100
85

VEL
25
61
46
132

Total
162
196
142
500

Solucin
Definicin de las Variables en estudio:
Variable 1:

Niveles:

Variable 2:

Niveles:

La siguiente tabla muestra tanto las frecuencias observadas como las esperadas (entre
parntesis)

1)

Formulacin de las hiptesis:


H0:
H1:

2)

Fijacin del nivel de significacin: 0,05.

Estadstica Aplicada

Pgina 54

3)

Estadstico de prueba:

4)

reas y criterio de decisin: ___________ g. l.


Criterio:

5)

2
>
Si Cal

se rechaza H0;

2
Si Cal

no se rechaza H0.

Clculos previos
2
2

6)

Conclusin:

Ejercicio 20.
La empresa que brinda servicios de Agua y Alcantarillado en la zona Sur de Lima desea
conocer si la calidad de servicio es percibida de manera similar (homognea) por los usuarios
que residen en los distintos distritos a los cuales se les brinda el servicio. Con esta finalidad
se extraen muestras aleatorias en los 5 distritos (de cada distrito una muestra) que atiende
la gerencia Sur: Miraflores, Surco, SJM, VMT y VS) y se obtienen los siguientes resultados:

Percepcion
de Calidad
del Servicio

Bueno
Regular
Malo
Total

Miraflores
46
22
22
90

Distrito de Residencia
Surco
SJM
VM
42
35
12
38
33
43
20
32
35
100
100
90

VEL
20
44
56
120

Total
155
180
165
500

Usar un nivel de significacin de 0,05 para probar si la calidad de servicio que perciben los
usuarios es similar en los tres distritos.

Estadstica Aplicada

Pgina 55

1.

Formulacin de las hiptesis


H0:

H1:

2.
3.

4.

Fijacin del nivel de significacin: 0,05

k
(o e ) 2
Estadstico de prueba: c2 i i ~ 2 con
ei
i 1
(r 1)(c 1) g. l.
reas y criterios de decisin:
_______________ g. l.
2
>
Si Cal

se rechaza H0,

Si Cal

no se rechaza H0

5. Clculos previos

7)

Conclusin:

Estadstica Aplicada

Pgina 56

Otras pruebas
Muchas tcnicas estadsticas necesitan que las variables (poblaciones) sigan una distribucin
normal. Las pruebas que realizan este tipo de anlisis son:

Los mtodos grficos Q-Q y PP.


Prueba de Kolmogorov-Smirnov.

En esta seccin se revisar la prueba de Kolmogorov-Smirnov con la ayuda del SPSS para
realizar los clculos.
Ejemplo 13.
Pruebe si la siguiente muestra proviene de una distribucin normal. Use 0,01.

12

15

16

18

19

14

10

15

16

14

Las hiptesis en este caso son las siguientes:


H0: La variable en estudio tiene una distribucin normal (El conjunto de datos
proviene de una poblacin normal)
H1: La variable en estudio no tiene una distribucin norma (El conjunto de datos No
proviene de una poblacin normal)
A continuacin se presentan los resultados obtenidos para esta prueba con SPSS:
Prueba de Kolmogorov-Smirnov para una muestra
X
N
Parmetros normales

a,b

Media
Desviacin tpica

Diferencias ms
extremas

Absoluta

10
14.90
2.644
.167

Positiva

.139

Negativa

-.167
.527
.944

Z de Kolmogorov-Smirnov
Sig. asintt. (bilateral)
a. La distribucin de contraste es la Normal.
b. Se han calculado a partir de los datos.

Comosig=0.944<=0,01entoncesNoRechazamosHo.
Conclusin: Al nivel de significacin del 1% se puede concluir que la distribucin normal
brinda un buen ajuste a estos datos.

Estadstica Aplicada

Pgina 57

Unidad 4 Diseos Experimentales


4.1. Conceptos Bsicos
Un experimento diseado es una prueba o serie de pruebas en las cuales se inducen cambios
deliberados en las variables de entrada (factores controlables, susceptibles a manipulacin)
de un proceso o sistema, de manera que sea posible observar e identificar las causas de los
cambios en la variable de salida (variable respuesta, variable dependiente no manipulable).
Suponga por ejemplo que el ejecutivo de marketing de la empresa ALOA S.A., desea saber si
los tipos de promocin (variable independiente) de un producto influye en las ventas del
mismo (variable dependiente), y de ser as qu promocin sera la recomendable. Por lo
tanto se plantea tres promociones distintas: P1, P2, P3.
Procedimiento:

La diferencia en las ventas promedios obtenidas con las diferentes promociones en


la muestra nos indica que efectivamente las promociones influyen en las ventas, o
slo se debe a la variabilidad inherente al muestreo? La promocin 3 es ms
efectiva?
Estadstica Aplicada

Pgina 58

Factor: Es una variable independiente o de entrada que puede afectar los resultados del
experimento. Los factores se pueden clasificar en controlables y no controlables.
Factor en estudio: Un factor en estudio es aquel cuyos valores son controlados y cuyo
efecto ser evaluado en los resultados del experimento. El inters principal del
experimentador es evaluar el efecto de estos factores. En el ejemplo anterior, la
promocin es el factor en estudio. A los distintos valores de los factores en estudio que
son evaluados se les llama niveles del factor. En el ejemplo, el factor promocin tiene
tres niveles.
Un experimento diseado puede tener dos o ms factores en estudio, por ejemplo,
podramos estar interesados en evaluar no slo las promociones sino adems las zonas y
el inters radicara en saber si las promociones tienen un efecto distinto en las zonas donde
se aplican (hay interaccin entre la promocin y las zonas?). En este caso los factores
son: Promocin y Zona.
Tratamiento: Un tratamiento corresponde a los niveles de un factor o a una combinacin
de los niveles de dos o ms factores en estudio y cuyo efecto se mide y compara con los
de otros tratamientos.
Unidad experimental: Es la unidad a la cual se le aplica un tratamiento y en la cual se
mide el efecto de un tratamiento. En el ejemplo, la unidad experimental podra ser un
empaque de alimento.
Variable respuesta: Es la variable en la cual se evaluarn los efectos de los tratamientos.
En el ejemplo, la variable respuesta puede ser el tiempo de duracin observado de cada
empaque.
Error experimental: Es la variabilidad existente entre los resultados de unidades
experimentales tratadas en forma similar. Cualquier factor no controlable contribuye al
error experimental. El error experimental proviene de dos fuentes principales:
variabilidad inherente al material experimental y variabilidad resultante de cualquier
falta de uniformidad en la realizacin fsica del experimento
En el ejemplo, a pesar que se aplic la promocin 1 a las cuatro tiendas, sus ventas son
distintas.

Principios Bsicos en el Diseo de Experimentos

Estadstica Aplicada

Pgina 59

En este curso se presentan dos casos de anlisis:


1.

El diseo completamente al azar (DCA): Este es un diseo en el que slo se contempla


un factor de estudio.
2.
El experimento factorial AxB: Este es un diseo con dos factores en estudio, con a y b
niveles respectivamente.

4.2. Diseo Completamente al Azar (DCA)


Objetivo: Medir el efecto del factor en estudio (variable independiente de naturaleza
cualitativa o cuantitativa) sobre la variable respuesta (variable dependiente de
naturaleza cuantitativa).
Suponga que se cuenta con los resultados de k muestras aleatorias independientes, cada una de
tamao ni, obtenidas desde k diferentes poblaciones y se desea probar la hiptesis de que las
medias de estas k poblaciones son todas iguales. Las poblaciones que se desea comparar
suelen ser producto de la aplicacin de distintos tratamientos a ciertas unidades de anlisis.
Considere por ejemplo el caso en el que se desea comparar el efecto de cinco programas de
incentivos en la productividad de los trabajadores; en este caso, los cinco programas de
incentivos seran los cinco tratamientos aplicados (los cuales definen las cinco poblaciones
que se van a comparar), y la unidad de anlisis sera un trabajador (quien recibe el
tratamiento).
Los datos a analizar pueden arreglarse en una tabla como la que se muestra a continuacin:

Tratamiento
Muestra

Tratamiento 1

Tratamiento 2

...

Tratamiento k

y11

y21

...

yk1

Y12

y22

...

yk2

y13

y23

...

yk3

...

...

...

ni

y 1n1

y 1n2

...

y 1nk

y1.

y2.

...

yk.

Totales yi.

Estadstica Aplicada

Pgina 60

Modelo:
Cada observacin yij se descompone en :
yij i ij para i 1, 2, ..., k ; j 1, 2, ..., ni
Donde:
yij

Representa la j- sima observacin en la i-sima muestra.

Media general.

Efecto del i-simo tratamiento.

ij

Error aleatorio asociado a la observacin yij, donde ij ~ N (0, 2 )

Supuestos del modelo:


El supuesto general es que los errores son variables aleatorias independientes con
distribucin normal con media cero y varianza constante 2 , ij ~ N (0; 2 )
Este supuesto implica que los datos provienen de poblaciones normales (supuesto de
normalidad) con varianza constante (supuesto de homogeneidad de varianzas).

Hiptesis:
La hiptesis nula plantea que no hay efecto de los tratamientos, luego no hay diferencia en
las medias poblacionales; por lo tanto expresamos las hiptesis de la siguiente manera:
H0:

1 = 2 = = k

No hay diferencia en las El factor en estudio no afecta


medias poblacionales

H1:

a la variable respuesta.

No todas las i son Hay diferencia en las El factor en estudio afecta a


iguales.

medias poblacionales

la variable respuesta.

Anlisis de Varianza
Consiste en analizar los cocientes de las varianzas para probar la hiptesis de igualdad o
desigualdad entre las medias debidas a los tratamientos. Para lo cual se separa la variacin
total en las partes con que contribuye cada fuente de variacin. En el caso l DCA las fuentes
de variacin son: Variacin entre grupos (debida a los tratamientos) y Variacin dentro del
grupo (debida al error experimental).
Con estas fuentes de variacin se obtienen los cuadrados de las sumatorias de las
desviaciones, tanto del tratamiento como del error y se construye una tabla de ANOVA que
nos servir para probar las hiptesis de este estudio.

Estadstica Aplicada

Pgina 61

Tabla del Anlisis de Varianza


Fuente

de

variacin

Grados de

Suma de

libertad

cuadrados

Fcal

Tratamientos

k1

SC(Tr)
i 1

Error

Cuadrado

yi2 y2

ni
n

n. k

SCE SCT SC(Tr)

n. 1

k
n
y2
SCT y ij2
n
i 1 j 1

Total

medio
CM(Tr)

CME

SC(Tr)
k 1
SCE
n k

CM (Tr )
CME

La regla de decisin es:


Si Fcal > Fcrit entonces se Rechaza la hiptesis nula a favor de
la H1 con el nivel de significacin , podemos concluir que los
tratamientos afectan a la variable respuesta.

Ejemplo 14.
El vicepresidente de mercadeo de un banco importante planea poner en marcha cierto tipo de
promociones para atraer nuevos clientes en cuatro sucursales del banco. l est convencido de
que diferentes tipos de promociones atraern a personas de diferentes grupos de ingreso, por
lo que, de haber diferencias entre los ingresos promedio de los clientes de cada sucursal, se
optar por un programa de promociones distinto para cada una. Considere a los montos de los
depsitos como una medida representativa de los ingresos de los clientes. En la siguiente tabla
se presentan datos para una muestra aleatoria de siete depsitos desde cada sucursal (en miles
de soles) Debe el vicepresidente optar por un programa de promociones distinto para cada
sucursal? Evale esta posibilidad con un nivel de significacin del 5%.
Depsito

Sucursal 1

Sucursal 2

Sucursal 3

Sucursal 4

5,3

3,3

3,6

4,3

2,6

4,6

2,8

2,5

3,6

2,1

4,5

1,8

3,8

3,5

3,8

3,0

2,7

5,0

1,9

3,9

5,1

2,8

4,1

3,5

4,2

2,5

5,1

4,1

Total Yi.

27,3

23,8

25,8

23,1

Estadstica Aplicada

Y.. = 100

Pgina 62

Solucin.
H0: No hay diferencia entre los montos promedios de los depsitos en las cuatro sucursales.
H1: Hay diferencia entre los montos promedios de los depsitos en las cuatro sucursales.
Los totales para las cuatro muestras son, respectivamente, 27,3; 23,8; 25,8 y 23,1, el gran total
es 100, y los clculos con que se obtienen las sumas de cuadrados necesarias son los
siguientes:
4 7

yij

2
i 1 j 1 (100) 357,1429
n.
28
2

SCT (5, 3) 2 (2, 6) 2 . . . (4,1) 2 357,14 27, 0171


SC(Tr)

(27, 3) 2 (23, 8) 2 (25, 8) 2 (23,1) 2


357,1429 1, 5686
7

La tabla del anlisis de varianza es:


ANOVA
Grados de

Suma de

Cuadrado

libertad

cuadrados

medio

41=3

1,5686

0,5229

Error

28 4 = 24

25,4486

1,0604

Total

28 1 = 27

27,0171

Fuente de variacin
Tratamientos

Puesto que el valor obtenido para Fc es menor que 3,01, que


corresponde al valor F 0,05 con 3 y 24 grados de libertad, la
hiptesis nula no puede ser rechazada con un nivel de
significacin de 0,05; se concluye entonces que no se puede
rechazar la hiptesis de que las medias de los depsitos en las
cuatro sucursales son iguales y la recomendacin sera no
implementar programas de promociones diferentes para cada
sucursal.

Fc

Fcrt

0,4931 3,01

F(3,24)

0.4931

A continuacin se presenta la salida del SPSS para el anlisis de varianza para una va de
este ejemplo, junto con las pruebas para la verificacin de los supuestos.

Estadstica Aplicada

Pgina 63

Supuestos
Verificacin del supuesto de homogeneidad de varianzas
H0: 12 22 32 42 (la varianza es la misma en las cuatro sucursales)
H1: Al menos una varianza es diferente.
Prueba de igualdad de Levene de varianzas
de error
Variable dependiente: Depositos
F

df1
,037

df2
3

Sig.
24

,990

Con un valor de probabilidad de 0,99, el resultado de esta prueba indica que no hay
suficiente evidencia estadstica para rechazar que las varianzas de las poblaciones de las
cuales se han extrado las muestras son similares.
Verificacin del supuesto de normalidad de los errores
H0: La distribucin de los errores en el modelo es normal.
H1: La distribucin de los errores en el modelo no es normal.

Con un valor de probabilidad > 0.200 (mayor que alfa), el resultado de esta prueba indica
que no hay suficiente evidencia estadstica para rechazar el supuesto de normalidad. La
distribucin de los errores en el modelo tiene distribucin normal
Anlisis de Varianza

Con un valor de probabilidad de 0,690 (mayor que alfa), no se rechaza la hiptesis nula lo
que indica que las medias de las cuatro sucursales son iguales.
Estadstica Aplicada

Pgina 64

Ejemplo 15.
La revista Money public los rendimientos de las acciones de los fondos de bonos. Los datos
siguientes son los rendimientos (%) de siete acciones de cuatro tipos de bonos: mid-cap,
small-cap, Irbid y Specialty (Money, dic del 2011)

a.

Mid-cap (A) (%)

Small-cap (B) (%)

Irbid (C) (%)

Specialty (D)(%)

1,2
1,1
1,0
1,2
1,3
1,8
1,4
9

2,0
1,2
1,7
1,8
1,5
2,3
1,9
12,4

2,0
2,7
1,8
1,5
2,5
1,0
0,9
12,4

1,6
2,7
2,6
2,5
1,9
1,5
1,6
14,4

48.2

Verifique los supuestos del modelo. Use un nivel de significacin de 1%.

Estadstica Aplicada

Pgina 65

b.

Los datos muestrales indican que los cuatro bonos tiene promedios distintos
rendimientos? Use = 0,05.

ANOVA
Fuentes de variacin

Suma de cuadrados

gl

Media cuadrtica

Sig.

Bonos
Error
Total

Estadstica Aplicada

Pgina 66

4.3. Pruebas para la diferencia de medias (Comparacin mltiple)


Cuando la hiptesis nula de la prueba F en el ANVA es rechazada, indica que al menos una de las
medias es diferente, pero no revela cul o cules de las medias son significativamente diferentes; en
estos casos se deben utilizar otras pruebas estadsticas. En esta seccin se presenta dos pruebas para
este propsito: la prueba DMS y la prueba de Duncan, las cuales permiten evaluar si existen
diferencias significativas entre las medias de cada par de tratamientos o grupos.

Ejemplo 16.
En el ejemplo anterior, del rendimiento de los bonos,

(i)
(ii)

qu tipos de fondos tienen el mismo rendimiento?


qu tipo de bonos son los que nos proporcionan diferentes rendimientos?
(iii) Si hay que elegir entre B y C, cul preferira?
(iv) Si hay que elegir entre A y D, cul preferira?
Use un nivel de significacin = 0,05.
Prueba de Diferencia Mnima Significativa (DMS)
Comparaciones mltiples
Variable dependiente Gastos
Diferencia de
(I) Tipo_fondo (J) Tipo_fondo medias (I-J) Error tpico Sig.

D:Specialty

Lmite
superior

-,4857

,2604

,074

-1,023

,052

C:Irbid

-,4857

,2604

,074

-1,023

,052

D:Specialty

-,7714

,2604

,007

-1,309

-,234

A:Mid-cap

,4857

,2604

,074

-,052

1,023

C:Irbid

,0000

,2604

1,000

-,537

,537

D:Specialty

-,2857

,2604

,283

-,823

,252

A:Mid-cap

,4857

,2604

,074

-,052

1,023

B:Small-cap

,0000

,2604

1,000

-,537

,537

D:Specialty

-,2857

,2604

,283

-,823

,252

A:Mid-cap

,7714

,2604

,007

,234

1,309

B:Small-cap

,2857

,2604

,283

-,252

,823

C:Irbid

,2857

,2604

,283

-,252

,823

B:Small-cap

C: Irbid

Lmite
inferior

B:Small-cap
A:Mid-cap

DMS

Intervalo de confianza
al 95%

A-D= 0
A-D< 0

*. La diferencia de medias es significativa al nivel 0.05.

Estadstica Aplicada

Pgina 67

A continuacin se presentan los resultados de la prueba DMS que reporta el SPSS:


Comparaciones

Intervalo

Conclusin

AyB

( - ; +)

A-B =0

A=B

AyC

( - ; +)

A-C=0

A=C

AyD

( - ; -)

A-D<0

A<D

ByC

( - ; +)

B-C=0

B=C

ByD

( - ; +)

B-D=0

B=D

CyD

( - ; +)

C-D=0

C=D

Estos resultados pueden resumirse en un diagrama de lneas como el que se muestra a


continuacin. La idea es que los tratamientos unidos por una lnea no presentan
diferencias significativas.
A

Prueba de Rango Mltiple de Duncan


Usando la salida de la prueba de DUNCAN que proporciona el SPSS
Gastos
Subconjunto para alfa = 0.05

Duncan

Tipos_de_fondos

Mid-cap (A)

1,286

Small-cap (B)

1,771

1,771

Irbid (C)

1,771

1,771

Specialty (D)

Sig.

2,057
,089

,311

Se forman dos conjuntos, uno con los tratamientos A, B y C y el otro con B, C y D


Nos da la misma informacin que la prueba DMS
Conclusin: Al nivel de significacin del 5% se puede afirmar que,
(i) los fondos de los bonos tipo A, B y C tienen el mismo rendimiento promedio, as
como los fondos de los bonos tipo B, C y D.
(ii) los fondos de los bonos tipo A y D tienen diferente rendimiento promedio.
(iii) en cuanto a los bonos B y C, cualquiera de ellos se podra elegir.
(iv) en cuanto a los bonos A y D, es preferible el bono tipo D por tener mayor
rendimiento promedio y ser significativo este resultado al nivel del 5%.
Estadstica Aplicada

Pgina 68

Ejercicio 21.
Una agencia gubernamental para la proteccin del medio ambiente ha establecido
reglamentos muy estrictos para el control de los deshechos de las fbricas. Una empresa
tiene cuatro plantas y sabe que la planta A satisface los requisitos impuestos por el gobierno
pero quisiera determinar cul es la situacin de las otras 3. Para el efecto se toman 5
muestras de los lquidos residuales de cada una de las plantas y se determina la cantidad de
contaminantes. Los resultados del experimento aparecen en la tabla.
Planta

Cantidad de contaminante

1,65 1,72

1,50

1,37 1,6

1,70 1,85

1,46

2,05 1,8

1,40 1,75

1,38

1,65 1,55

2,10 1,95

1,65

1,88 2,00

Proporcionan los datos anteriores evidencia suficiente que indique que existe una diferencia
en la cantidad media de contaminantes para las cuatro plantas?

Pruebas de los efectos inter-sujetos


Variable dependiente:Cantidad de contaminante
Suma de
cuadrados tipo
Media
Origen
III
gl
cuadrtica
a
Modelo corregido
,465
3
,155
Interseccin
57,834
1
57,834
Planta
,465
3
,155
Error
,477
16
,030
Total

58,776

20

,942

19

Total corregida

F
5,200
1940,738
5,200

Sig.
,011
,000
,011

a. R cuadrado = ,494 (R cuadrado corregida = ,399)

Cantidad de contaminante
Subconjunto
Duncana,b

Planta
C

1
1,5460

1,5680

B
D

5
5

1,7720

1,7720
1,9160

,066

,206

Sig.

Se muestran las medias de los grupos de subconjuntos homogneos.


Basadas en las medias observadas.
El trmino de error es la media cuadrtica(Error) = ,030.
a. Usa el tamao muestral de la media armnica = 5,000
b. Alfa = ,05.

Estadstica Aplicada

Pgina 69

a. Verifique los supuestos del modelo. Use un nivel de significacin del 5%

b. Pruebe si existen diferencias en la emisin de contaminantes en alguna de las


plantas. Use un nivel de significacin del 5%.

c. Qu planta o plantas emiten ms contenido de contaminantes?

Estadstica Aplicada

Pgina 70

4.4. Experimento Factorial AxB.


Objetivo: Aplicar un experimento de dos factores con y sin interaccin, sobre
problemas de su especialidad.
Usualmente en los experimentos se desea estudiar el efecto de dos o ms factores. Por
diseo factorial se entiende que en cada ensayo o rplica completa del experimento se
investigan todas las combinaciones posibles de los niveles de los factores. Cada factorial
(tratamiento) es la combinacin de los niveles de los factores.
Por ejemplo.
Factor A con a=2 niveles (a1 y a2) y el Factor B con b =3 niveles (b1, b2 y b3)
Replica: n=3
Factor A

Replica
1
2
3

b1

a1
Factor B
b2

b3

b1

a2
Factor B
b2

b3

Se necesitan 2x3x3=18 unidades experimentales.

Modelo:
yijk i j ( )ij ijk
donde:
i 1, 2,..., a
j 1, 2,..., b
k 1, 2,..., n
En este modelo es el efecto de la media general, i es el efecto del nivel i-simo del factor
A, j es el efecto del nivel j-simo del factor B, ( )ij es el efecto de la interaccin entre
ambos factores, y ijk es un componente de error aleatorio. Se supone que los errores tienen
distribucin normal con media cero y varianza constante.

Estadstica Aplicada

Pgina 71

El cuadro del ANVA ahora es


Grados de
libertad (gl)

Sumas de Cuadrados (SC)

Cuadrados Medios
(CM)

Fcal

Factor A

a1

SC(A)

SC( A)
gl( A)

CM( A)
CM(Error)

Factor B

b1

SC(B)

SC(B)
gl(B)

CM( B)
CM(Error)

(a1)(b-1)

SC(AxB)

SC( AB)
gl( AB)

CM( AB)
CM(Error)

ab( n 1)

SC(Error)

SC(Error)
gl(Error)

abn 1

SC(Total)

Fuentes de variacin

Interaccin AxB

Error Experimental
Total

Procedimiento para el anlisis:


Paso 1: Prueba de hiptesis para la interaccin
Ho: No hay interaccin entre los niveles del factor A con los niveles del factor B
H1: Hay interaccin entre los niveles del factor A con los niveles del factor B.
Estadstico de prueba:

Paso 2:
Si en el paso 1 no se rechaza la hiptesis nula (NRHo), entonces, no hay interaccin y
se debe analizar cada factor por separado, como en un Diseo Completamente al Azar
(DCA).
Ho: El factor A no afecta a la variable Ho: El factor B no afecta a la variable
respuesta
respuesta
H1: El factor A afecta a la variable respuesta H1: El factor B afecta a la variable respuesta

Para la prueba que se rechace (para el factor que si afecte) y siempre y cuando los
niveles del factor sean tres o ms se debe realizar la prueba de Duncan.
Si en el paso 1 se rechaza la hiptesis nula (RHo), entonces, hay interaccin se debe
realizar un anlisis de DMS fijando un nivel y comparando los niveles del otro factor.
Estadstica Aplicada

Pgina 72

Ejercicio 22.
Una empresa de pedidos por correo dise un experimento factorial para investigar el efecto
que tiene el diseo del anuncio y el tamao del anuncio en revistas, sobre la cantidad de
pedidos recibidos (en miles). Se consideraron tres diseos de anuncios y dos tamaos de
anuncios. Los datos que se obtuvieron corresponden a la cantidad de pedidos en miles y
aparecen en la tabla siguiente.
Tamao del anuncio
Pequeo

Grande

8
12
14
22
14
20
10
18
15

12
8
16
26
30
30
18
14
17

Diseo

Aplique el procedimiento de anlisis de varianza para experimentos factoriales e investigue el


efecto del tipo de diseo y el tamao del anuncio en forma conjunta, sobre la cantidad de
pedidos recibidos. De ser necesario realice las pruebas de comparacin. Use 0,01

Prueba de Kolmogorov-Smirnov para una muestra

N
Parmetros normalesa,b
Mximas diferencias
extremas

Media
Desviacin estndar
Absoluta
Positivo
Negativo

Estadstico de prueba
Sig. asinttica (bilateral)
a. La distribucin de prueba es normal.
b. Se calcula a partir de datos.
c. Correccin de significacin de Lilliefors.

Estadstica Aplicada

Residuo para
Valores
18
.0000
2.84226
.204
.127
-.204
.204
.046c

Prueba de igualdad de Levene de


varianzas de errora
Variable dependiente: Valores
.460

df1

df2

Sig.

12

.798

Prueba la hiptesis nula que la varianza de


error de la variable dependiente es igual entre
grupos.
a. Diseo : Interceptacin + Fila + Columna +
Fila * Columna

Pgina 73

Pruebas de efectos inter-sujetos


Variable dependiente: Valores
Tipo III de suma
Origen

de cuadrados

Cuadrtico
gl

promedio

Sig.

Modelo corregido

610.444a

122.089

10.668

.000

Interceptacin Fila

5134.222

5134.222

448.621

.000

(Diseo) Columna

453.778

226.889

19.825

.000

(Tamao) Fila *

80.222

80.222

7.010

.021

Columna

76.444

38.222

3.340

.070

Error

137.333

12

11.444

Total

5882.000

18

747.778

17

Total corregido

a. R al cuadrado = .816 (R al cuadrado ajustada = .740)

Pruebas post hoc


Fila (Factor = Diseo con 3 niveles )
Comparaciones mltiples
Variable dependiente: Valores

DMS

(I) Fila
1.00

(J) Fila
2.00
3.00

Diferencia de
medias (I-J)
-12.0000*

Error
estndar
1.95316

Sig.
.000

-3.6667
1.95316
12.0000*
1.95316
1.00
*
8.3333
1.95316
3.00
3.6667
1.95316
3.00
1.00
*
-8.3333
1.95316
2.00
Se basa en las medias observadas.
El trmino de error es la media cuadrtica(Error) = 11.444.
*. La diferencia de medias es significativa en el nivel .05.

.085
.000
.001
.085
.001

2.00

Intervalo de confianza al
95%
Lmite
Lmite
inferior
superior
-16.2556
-7.7444
-7.9222
7.7444
4.0778
-.5889
-12.5889

.5889
16.2556
12.5889
7.9222
-4.0778

Valores

Duncana,b

Fila
1.00
3.00
2.00
Sig.

N
6
6
6

Subconjunto
1
2
11.6667
15.3333
.085

23.6667
1.000

Se visualizan las medias para los grupos en los subconjuntos


homogneos.
Se basa en las medias observadas.
El trmino de error es la media cuadrtica(Error) = 11.444.
a. Utiliza el tamao de la muestra de la media armnica = 6.000.
b. Alfa = .05.

Estadstica Aplicada

Pgina 74

Realice el anlisis correspondiente al nivel de significacin del 1% ( 0,01 ).

Estadstica Aplicada

Pgina 75

Ejemplo 17.
El administrador de una empresa de confecciones de pantalones para dama, desea hacer un
estudio del tiempo de fabricacin (min) que demora cada una de las actividades principales
(corte, confeccin y acabado) involucradas en el proceso de fabricacin de pantalones y
piensa, que stas interaccionan con el tipo de tela que usa en la fabricacin de las prendas
(material 1, material 2 y material 3). Se realizaran cuatro repeticiones en cada actividad por
cada tipo de tela, y las 36 pruebas se realizan de manera aleatoria.
La tabla siguiente muestra los tiempos en minutos para cada actividad segn el tipo de tela
usada en la fabricacin de la prenda:
Tiempo de fabricacin (min)
Actividad (B)

Tipo de tela
(A)
M1
M2
M3

Corte
130
74
150
159
138
168

Confeccin
155
180
188
126
110
160

34
80
136
106
174
150

Acabado

40
75
122
115
120
139

20
82
25
58
96
82

70
58
70
45
104
60

Suponiendo que se cumplen los supuestos del modelo, realice el anlisis correspondiente.
A continuacin se presenta el reporte del SPSS ver.22 del anlisis de varianza.
Pruebas de los efectos inter-sujetos
Variable dependiente:Tiempo
Origen
Modelo corregido

Suma de cuadrados tipo I


a

gl

Media cuadrtica

Sig.

Interseccin

59416,222
400900,028

8
1

7427,028
400900,028

11,000
593,739

,000
,000

Actividad

39118,722

19559,361

28,968

,000

Tipo_tela

10683,722

5341,861

7,911

,002

Actividad * Tipo_tela

9613,778

2403,444

3,560

,019

Error

18230,750

27

675,213

Total

478547,000

36

Total corregida
77646,972
a. R cuadrado = .765 (R cuadrado corregida = .696)

35

A partir del ANOVA (prueba inter-sujetos) se verifica la siguiente hiptesis:


Ho: No hay interaccin entre los niveles del tipo de tela y los niveles de la actividad para la
confeccin del pantaln.
H1: Hay interaccin entre los niveles del tipo de tela y los niveles de la actividad para la
confeccin del pantaln.
Se compara Fcal = 3,56 y con Sig. = 0,019 < = 0,05 se rechaza Ho (RHo), por lo que se
concluye que existe un efecto de interaccin entre el tipo de tela y la actividad sobre el
tiempo de fabricacin de la prenda, por lo tanto se debe analizar los efectos simples. En este
caso se analizar el siguiente DMS que reporta el SPSS.

Estadstica Aplicada

Pgina 76

Comparaciones por pares


Variable dependiente:Tiempo

Actividad
Corte

(I)Tipo_tela
M1
M2
M3

Confeccin

M1
M2
M3

Acabado

M1

Intervalo de confianza al 95 % para la


a
diferencia

Diferencia de
medias (I-J)
-21,000
-9,250

Error tp.
18,374
18,374

21,000
11,750

M2
M2
M3
M1
M3
M1
M2
M2
M3

(J)Tipo_tela
M2
M3
M1
M3
M1

Sig.

,263
,619

Lmite inferior
-58,700
-46,950

Lmite superior
16,700
28,450

18,374
18,374

,263
,528

-16,700
-25,950

58,700
49,450

9,250
-11,750
-62,500*
-88,500*
62,500*
-26,000
88,500*
26,000
8,000

18,374
18,374
18,374
18,374
18,374
18,374
18,374
18,374
18,374

,619
,528
,002
,000
,002
,168
,000
,168
,667

-28,450
-49,450
-100,200
-126,200
24,800
-63,700
50,800
-11,700
-29,700

46,950
25,950
-24,800
-50,800
100,200
11,700
126,200
63,700
45,700

-28,000

18,374

,139

-65,700

9,700

-45,700
-73,700

29,700
1,700

-9,700
-1,700

65,700
73,700

-8,000
18,374
,667
M1
-36,000
18,374
,060
M3
28,000
18,374
,139
M3
M1
36,000
18,374
,060
M2
Basadas en las medias marginales estimadas.
a. Ajuste para comparaciones mltiples: Diferencia menos significativa (equivalente a la ausencia de ajuste).
*. La diferencia de medias es significativa al nivel ,05.
M2

Se analizar fijando los niveles de un factor y comparando entre todos los niveles del otro
factor.
Fijemos: Corte:
Comparaciones

Intervalo de confianza

Conclusin

M1 y M2

( - ; +)

1=2

M1 y M3

( - ; +)

1=3

M2 y M3

( - ; +)

2=3

1 = 2 = 3
Conclusin: Al nivel de significacin del 5%, en la actividad de Corte no se ha probado que
algn tipo de tela tiene demore ms que otro.
Fijemos: Confeccin
Comparaciones

Intervalo de confianza

Conclusin

M1 y M2

( - ; -)

1<2

M1 y M3

( - ; -)

1<3

M2 y M3

( - ; +)

2=3

1 < 2 = 3

Conclusin: Al nivel de significacin del 5%, se puede concluir que en la actividad:


Confeccin el tipo de tela M1 es el que demanda de menos tiempo.
Estadstica Aplicada

Pgina 77

Fijemos: Acabado
Comparaciones

Intervalo de confianza

Conclusin

M1 y M2

( - ; +)

1=2

M1 y M3

( - ; +)

1=3

M2 y M3

( - ; +)

2=3

1 = 2 = 3
Conclusin: Al nivel de significacin del 5%, en la actividad: Acabado no se prob que
algn tipo de tela demanda ms que otra.
Ejercicio 23.
El administrador de una tienda de ropas para mujer desea lanzar tres lneas de ropa: L1, L2 y
L3, y considera que el grupo de edad es un factor importante a considerar, por lo que clasifica
a sus clientes en grupo 1=G1 (menores de 20 aos), grupo 2=G2 (entre 20 y 30 aos) y
grupo 3=G3 (mayores de 30 aos). Enva cartas de invitacin a 9 clientes del grupo 1, a 9 del
grupo 2 y a 9 del grupo 3. Cuando llegan a la tienda, las 9 clientes del grupo 1 se elige
aleatoriamente a 3 y se les enva al sector de la L1, a otras 3 al sector de la lnea 2 y las 3
restantes al sector de la lnea 3. Lo mismo se hace cuando llegan las clientes de los otros dos
grupos de edades. Luego se les pide que den una puntuacin entre 1 y 10, donde 1 nunca lo
usaran y 10 estaran encantadas de usarlo. A continuacin se presentan los reportes del SPSS
del anlisis factorial. Concluya con un =0.01.

Grupo de
edad
G1

G2

G3

Estadstica Aplicada

Lneas de ropa
L1
7

L2
6

L3
5

Pgina 78

Ejemplo 18.

Prueba de igualdad de Levene de varianzas de


errora
Variable dependiente: Datos
F
df1
df2
Sig.
.244
8
18
.976
Prueba la hiptesis nula que la varianza de error
de la variable dependiente es igual entre grupos.
a. Diseo : Interceptacin + Grupo + Lnea +
Grupo * Lnea

Prueba de Kolmogorov-Smirnov para una muestra


Residuo
para Datos
27
N
a,b
.0000
Parmetros normales
Media
Desviacin
.66023
estndar
.175
Mximas diferencias
Absoluta
.175
extremas
Positivo
-.140
Negativo
.175
Estadstico de prueba
.034c
Sig. asinttica (bilateral)
a. La distribucin de prueba es normal.
b. Se calcula a partir de datos.
c. Correccin de significacin de Lilliefors.

Pruebas de efectos inter-sujetos


Variable dependiente: Datos
Tipo III de suma
Cuadrtico
Origen
de cuadrados
promedio
gl
Modelo corregido
34.667a
8
4.333
Interceptacin
972.000
1
972.000
.889
2
.444
Grupo (Factor_A)
2.889
2
1.444
Lnea (Factor_B)
Grupo * Lnea
30.889
4
7.722
Factor_A * Factor_B

Error

11.333

18

Total

1018.000

27

46.000

26

Total corregido

F
6.882
1543.765
.706
2.294

Sig.
.000
.000
.507
.130

12.265

.000

.630

a. R al cuadrado = .754 (R al cuadrado ajustada = .644)

Estadstica Aplicada

Pgina 79

1. Factor_A * Factor_B
Grupos de edad * Lneas de ropa

Factor_A = Grupos de edad


Factor_B = Lneas de ropa

Comparaciones por parejas


Variable dependiente: Y

Factor_A
G1

(I) Factor_B
L1
L2
L3

G2

L1
L2
L3

G3

L1
L2
L3

(J) Factor_B
L2
L3
L1
L3
L1
L2
L2
L3
L1
L3
L1
L2
L2
L3
L1
L3
L1
L2

Diferencia de
medias (I-J)
1.333
2.000
-1.333
.667
-2.000
-.667
.333
-1.667
-.333
-2.000
1.667
2.000
-2.333
1.333
2.333
3.667
-1.333
-3.667

Error
estndar
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648

Sig.b
.054
.006
.054
.317
.006
.317
.613
.019
.613
.006
.019
.006
.002
.054
.002
.000
.054
.000

95% de intervalo de confianza


para diferenciab
Lmite inferior Lmite superior
-.028
2.694
.639
3.361
-2.694
.028
-.694
2.028
-3.361
-.639
-2.028
.694
-1.028
1.694
-3.028
-.306
-1.694
1.028
-3.361
-.639
.306
3.028
.639
3.361
-3.694
-.972
-.028
2.694
.972
3.694
2.306
5.028
-2.694
.028
-5.028
-2.306

Se basa en medias marginales estimadas


. La diferencia de medias es significativa en el nivel .05.
b. Ajuste para varias comparaciones: menor diferencia significativa (equivalente a sin ajustes).

Estadstica Aplicada

Pgina 80

2. Factor_A * Factor_B
Grupos de edad * Lneas de ropa

Factor_A = Grupos de edad


Factor_B = Lneas de ropa

Comparaciones por parejas


Variable dependiente: Y

Factor_B
L1

(I) Factor_A
G1
G2
G3

L2

G1
G2
G3

L3

G1
G2
G3

(J) Factor_A
G2
G3
G1
G3
G1
G2
G2
G3
G1
G3
G1
G2
G2
G3
G1
G3
G1
G2

Diferencia de
medias (I-J)
2.000
1.667
-2.000
-.333
-1.667
.333
1.000
-2.000
-1.000
-3.000
2.000
3.000
-1.667
1.000
1.667
2.667
-1.000
-2.667

Error
estndar
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648
.648

Sig.b
.006
.019
.006
.613
.019
.613
.140
.006
.140
.000
.006
.000
.019
.140
.019
.001
.140
.001

95% de intervalo de confianza


para diferenciab
Lmite inferior Lmite superior
.639
3.361
.306
3.028
-3.361
-.639
-1.694
1.028
-3.028
-.306
-1.028
1.694
-.361
2.361
-3.361
-.639
-2.361
.361
-4.361
-1.639
.639
3.361
1.639
4.361
-3.028
-.306
-.361
2.361
.306
3.028
1.306
4.028
-2.361
.361
-4.028
-1.306

Se basa en medias marginales estimadas


. La diferencia de medias es significativa en el nivel .05.
b. Ajuste para varias comparaciones: menor diferencia significativa (equivalente a sin ajustes).

Estadstica Aplicada

Pgina 81

a) Pruebe los supuestos del modelo. Use un =0,01

b) Existe interaccin entre las lneas de ropa y el grupo de edad? Esto es, alguna lnea de
ropa es preferible por algn grupo de edad ms que otro? Use un =0,01

c) Plantee las hiptesis correspondientes y responda: (use = 0,01)


c.1) La lnea de ropa L1, qu grupo de edad la prefiere?
c.2) El grupo de edad G3, qu lnea de ropa prefiere?

Estadstica Aplicada

Pgina 82

Ejercicios propuestos 4.
31. En un experimento se compararon tres mtodos de ensear un idioma extranjero para
evaluar la efectividad (cantidad de palabras correctas), se administr una prueba de
vocabulario de 50 palabras a los 15 estudiantes que participaron en el estudio, en grupos
de cinco por cada mtodo y se registraron el nmero de palabras que escriban
correctamente.
Mtodos de ensear
Met 1

Met 2

Met 3

48

40

50

45

39

48

49

41

49

47

31

44

45

34

48

Prueba de Kolmogorov-Smirnov para una muestra


Residuo para
Cantidad
15
N
a,b
Parmetros normales
Media
,0000
Desviacin tpica
2,77231
Diferencias ms extremas
Absoluta
,195
,080
Positiva
Negativa
-,195
,757
Z de Kolmogorov-Smirnov
,616
Sig. asintt. (bilateral)

Contraste de Levene sobre la igualdad de las


varianzas errora
Variable dependiente:Cantidad
F
gl1
gl2
Sig.
4,310
2
12
,039
Contrasta la hiptesis nula de que la varianza error de la variable
dependiente es igual a lo largo de todos los grupos.
a. Diseo: Interseccin + Metodo

a. La distribucin de contraste es la Normal.


b. Se han calculado a partir de los datos.

Comparaciones mltiples
Variable dependiente:Cantidad

DMS

(I)Metodo
M1
M2
M3

(J)Metodo
M2
M3
M1
M3
M1
M2

Diferencia de
medias (I-J)
9,80*
-1,00
*
-9,80
*
-10,80
1,00
10,80*

Intervalo de confianza 95%


Error tp.
1,894
1,894
1,894

Sig.
,000
,607
,000

Lmite inferior
5,67
-5,13
-13,93

Lmite superior
13,93
3,13
-5,67

1,894
1,894
1,894

,000
,607
,000

-14,93
-3,13
6,67

-6,67
5,13
14,93

Basadas en las medias observadas.


El trmino de error es la media cuadrtica(Error) = 8,967.
*. La diferencia de medias es significativa al nivel ,05.

a) Verifique los supuestos al nivel de significacin del 1%.


b) Calcule Realice el anlisis de varianza para probar si el nmero promedio de
palabras que recuerdan completamente los estudiantes depende del mtodo de
enseanza que siguieron.
Rpta: Fcal=19.859
c) Interprete el grfico de las medias marginales y corrobore lo observado con la
prueba de DMS. Use el nivel de significacin del 5%.
32. El administrador del caf-bar: Keirolo tiene la sospecha que los gastos que realizan sus
clientes es diferente en sus tres sucursales. Por lo que seleccion aleatoriamente a 4
clientes de la sucursal 1, luego a 3 de la sucursal 2 y a 5 clientes de la sucursal 3 y se
registraron los gastos (en soles) que realizaron en un cierto da. Aqu los resultados:
Sucursal 1
Sucursal 2
Sucursal 3

Estadstica Aplicada

28
26
23

58
54
28

46
42
45

29
30

38

Pgina 83

a) Pruebe los supuestos del modelo. Use un = 0.05.


b) Los datos obtenidos apoyan la sospecha del administrador. Use = 0.05

Rpta: NO

33. Para determinar la mejor disposicin de los instrumentos sobre el tablero de control de
un aeroplano, se prueban tres distintas disposiciones simulando una situacin de
emergencia y se observa el tiempo de reaccin requerido para corregir la avera. Los
tiempos de reaccin (en dcimas de segundo) de 28 pilotos son los siguientes:

Disposicin 1

14

13

15

11

13

14

10

12

Disposicin 2

10

12

11

12

10

Disposicin 3

11

10

a) Verifique los supuestos del modelo con un nivel de significacin de 0,01


b) Con un nivel de significacin de 0,01 pruebe si se la disposicin del instrumento sobre
el tablero de control afecta al tiempo de reaccin del piloto en una situacin de
emergencia.
c) Si es necesario realice la prueba de comparaciones de DMS y diga si es posible
concluir que disposicin es mejor. Use un =0,01

Estadstica Aplicada

Pgina 84

a. Se rechaza la hiptesis nula.


b. Las disposiciones 2 o 3 nos darn un mejor tiempo promedio de reaccin, por lo
tanto seran las ms convenientes.

34. Qu tipos de comerciales de televisin captan mejor la atencin de los nios? Para dar
respuesta a esta pregunta, se observ la actitud de 15 nios; 5 nios fueron observados
mientras vean comerciales de juguetes y juegos, 5 mientras vean comerciales sobre
comida y goma de mascar y 5 vean comerciales relacionados con ropa para nios.
Todos los comerciales tenan 60 segundos de duracin. En la siguiente tabla aparecen
los tiempos de atencin a los comerciales para los 15 nios.
TComercial
Juguetes, juegos
Comida, goma de mascar
Ropa

Tiempos de atencin (seg)


45
40
30
25 45
50
25
55
45 50
30
45
40
50 35

a) Verifique los supuestos del modelo.


b) Complete el cuadro de anlisis de varianza. Plantee las hiptesis del estudio y de sus
conclusiones al nivel de significacin del 5%.
c) De ser necesario realice la prueba de comparacin de DMS.
Contraste de Levene sobre la igualdad de las
a
varianzas error
Variable dependiente:Tiempo de atencin
F
gl1
gl2
Sig.
,197
2
12
,824
Contrasta la hiptesis nula de que la varianza error de la variable
dependiente es igual a lo largo de todos los grupos.
a. Diseo: Interseccin + Comercial

Prueba de Kolmogorov-Smirnov para una muestra


Residuo para
Tiempo
15
N
a,b
Parmetros normales
Media
,0000
Desviacin tpica
8,98411
Diferencias ms extremas
Absoluta
,178
Positiva
,133
Negativa
-,178
Z de Kolmogorov-Smirnov
,688
Sig. asintt. (bilateral)
,730
a. La distribucin de contraste es la Normal.
b. Se han calculado a partir de los datos.

Estadstica Aplicada

Pgina 85

Comparaciones mltiples
Variable dependiente:Tiempo de atencin

DMS

(I)Comercial
Juguetes

(J)Comercial
Comida
Ropa
Juguetes
Ropa
Juguetes
Comida

Comida
Ropa

Diferencia de
medias (I-J)
-8,00
-3,00
8,00
5,00
3,00
-5,00

Intervalo de confianza 95%


Error tp.
6,137
6,137
6,137
6,137
6,137
6,137

Sig.
,217
,634
,217
,431
,634
,431

Lmite inferior
-21,37
-16,37
-5,37
-8,37
-10,37
-18,37

Lmite superior
5,37
10,37
21,37
18,37
16,37
8,37

Basadas en las medias observadas.


El trmino de error es la media cuadrtica(Error) = 94,167 .

35. El Director de un supermercado est interesado en estudiar el efecto llamado de estantera


en las ventas de un producto. El producto se encuentra situado en A: a nivel bajo, B: nivel
de las manos, C: a nivel de la vista. para realizar el experimento, los supermercados han
sido clasificados segn su tamao.
Tamao del
Supermercado
Pequeo

Grande

Nivel bajo
55
60
62
80
98
84

Ubicacin en la estantera
Nivel de las manos
A nivel de la vista
67
76
83
83
74
80
85
92
97
103
90
98

Identifique el modelo y sus componentes, los factores, los niveles del factor y la variable
respuesta. Realice el anlisis de variancia y de ser necesarias las pruebas de comparaciones.
Concluya con un nivel de significacin del 5%.

Estadstica Aplicada

Pgina 86

Prueba de igualdad de Levene de varianzas de


errora
Variable dependiente: Ventas
F
df1
df2
Sig.
1.025

12

.446

Prueba la hiptesis nula que la varianza de error


de la variable dependiente es igual entre grupos.
a. Diseo : Interceptacin + Tamao_SuperM +
Ubicacin_Estantera + Tamao_SuperM *
Ubicacin_Estantera

Prueba de Kolmogorov-Smirnov para una muestra


Residuo para
Ventas
N
Parmetros normalesa,b

Media
Desviacin
estndar

18
.0000
5.37605
.121
.121
-.077
.121
.200c,d

Mximas diferencias extremas Absoluta


Positivo
Negativo
Estadstico de prueba
Sig. asinttica (bilateral)
a. La distribucin de prueba es normal.
b. Se calcula a partir de datos.
c. Correccin de significacin de Lilliefors.

d. Esto es un lmite inferior de la significacin verdadera.

Pruebas de efectos inter-sujetos


Variable dependiente: Ventas
Tipo III de suma
Cuadrtico
Origen
de cuadrados
promedio
gl
Modelo corregido
2807.167a
5
561.433
119560.500
1
119560.500
Interceptacin
Tamao_SuperM
1942.722
1
1942.722
Ubicacin_Estantera
733.000
2
366.500
Tamao_SuperM
*
131.444
2
65.722
Ubicacin_Estantera
Error
491.333
12
40.944
Total
122859.000
18
Total corregido

3298.500

F
13.712
2920.066
47.448
8.951

Sig.
.000
.000
.000
.004

1.605

.241

17

a. R al cuadrado = .851 (R al cuadrado ajustada = .789)


Comparaciones mltiples
Variable dependiente: Ventas

(I)Ubicacin_Estantera (J)Ubicacin_Estantera

Diferencia de
medias (I-J)

-9.5000*
Nivel de las manos
A nivel de la vista
-15.5000*
Nivel de las manos
9.5000*
Nivel bajo
A nivel de la vista
-6.0000
A nivel de la vista
15.5000*
Nivel bajo
Nivel de las manos
6.0000
Se basa en las medias observadas.
El trmino de error es la media cuadrtica(Error) = 40.944.
*. La diferencia de medias es significativa en el nivel .05.

DMS

Nivel bajo

Estadstica Aplicada

Error
estndar
3.69434
3.69434
3.69434
3.69434
3.69434
3.69434

Sig.
.024
.001
.024
.130
.001
.130

Intervalo de
confianza al 95%
Lmite
Lmite
inferior
superior
-17.5493 -1.4507
-23.5493 -7.4507
1.4507 17.5493
-14.0493
2.0493
7.4507 23.5493
-2.0493 14.0493

Pgina 87

Ventas

Duncana,b

Ubicacin_Estantera
Nivel bajo

N
6

Subconjunto
1
2
73.1667

Nivel de las manos

82.6667

A nivel de la vista

88.6667

Sig.

1.000

.130

Se visualizan las medias para los grupos en los subconjuntos homogneos.


Se basa en las medias observadas.
El trmino de error es la media cuadrtica(Error) = 40.944.
a. Utiliza el tamao de la muestra de la media armnica = 6.000.
b. Alfa = .05.

Ejemplo 19.
36. Se ha determinado la vida til de 3 marcas de pilas A 1, A2, A3, clasificadas segn sus
costos 1,6; 2,2 y 2,7. La duracin en horas se muestra en la siguiente tabla:
Costo
(soles)
1,6

2,2

2,7

A1
110
100
95
90
70
85
130
140
120

Marcas de pilas
A2
150
140
160
120
110
125
130
120
140

A3
90
80
95
80
70
95
100
90
105

Identifique el modelo y sus componentes, los factores, los niveles de los factores y la
variable respuesta. Cantidad de tratamientos. Verifique si se cumplen los supuestos del
diseo. Realice el anlisis de variancia y de ser necesarias las pruebas de comparaciones.
Utilice en el anlisis, un nivel de significacin del 5%.
Las salidas asociadas al diseo se muestran a continuacin:
Prueba de igualdad de Levene de varianzas de
errora
Variable dependiente: Y
F
df1
df2
Sig.
.216
8
18
.984
Prueba la hiptesis nula que la varianza de error
de la variable dependiente es igual entre grupos.
a. Diseo : Interceptacin + Factor_A + Factor_B +
Factor_A * Factor_B

Estadstica Aplicada

Prueba de Kolmogorov-Smirnov para una muestra


Residuo
para Y
27
N
.0000
Parmetros normalesa,b
Media
Desviacin
7.63763
estndar
.159
Mximas diferencias extremas Absoluta
.159
Positivo
-.142
Negativo
.159
Estadstico de prueba
.079c
Sig. asinttica (bilateral)
a. La distribucin de prueba es normal.
b. Se calcula a partir de datos.
c. Correccin de significacin de Lilliefors.

Pgina 88

Pruebas de efectos inter-sujetos


Variable dependiente: Y
Tipo III de suma
Cuadrtico
Origen
de cuadrados
gl
promedio
Modelo corregido
15457.407a
8
1932.176
325600.926
1
325600.926
Interceptacin
Factor_A
2
1889.815
3779.630
2
4270.370
8540.741
Factor_B
4
784.259
3137.037
Factor_A * Factor_B
Error
1516.667
18
84.259
Total
342575.000
27
Total corregido

16974.074

F
22.931
3864.275
22.429
50.681
9.308

Sig.
.000
.000
.000
.000
.000

26

a. R al cuadrado = .911 (R al cuadrado ajustada = .871)

1. Factor_A * Factor_B
Costo (Soles) * Marca de Pila

Factor_A = Costo (Soles)


Factor_B = Marca de Pila

Comparaciones por parejas


Variable dependiente: Y

Factor_B
A1

A2

A3

(I) Factor_A (J) Factor_A


1.60
2.20
2.70
2.20
1.60
2.70
2.70
1.60
2.20
1.60
2.20
2.70
2.20
1.60
2.70
2.70
1.60
2.20
1.60
2.20
2.70
2.20
1.60
2.70
2.70
1.60
2.20

Estadstica Aplicada

Diferencia de
medias (I-J)
20.000
-36.667
-20.000
-56.667
36.667
56.667
31.667
20.000
-31.667
-11.667
-20.000
11.667
6.667
-10.000
-6.667
-16.667
10.000
16.667

Error
estndar
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495
7.495

Sig.b
.016
.000
.016
.000
.000
.000
.001
.016
.001
.137
.016
.137
.385
.199
.385
.039
.199
.039

95% de intervalo de confianza


para diferenciab
Lmite inferior Lmite superior
4.254
35.746
-52.413
-20.921
-35.746
-4.254
-72.413
-40.921
20.921
52.413
40.921
72.413
15.921
47.413
4.254
35.746
-47.413
-15.921
-27.413
4.079
-35.746
-4.254
-4.079
27.413
-9.079
22.413
-25.746
5.746
-22.413
9.079
-32.413
-.921
-5.746
25.746
.921
32.413

Pgina 89

Factor_A * Factor_B
Costo (Soles) * Marca de Pila

Factor_A = Costo (Soles)


Factor_B = Marca de Pila

Comparaciones por parejas


Variable dependiente: Y
95% de intervalo de confianza
para diferenciab
Diferencia de
Error
Factor_A
(I) Factor_B (J) Factor_B medias (I-J)
estndar
Sig.b
Lmite inferior Lmite superior
-48.333
7.495
.000
-64.079
-32.587
1.60
A1
A2
A3
13.333
7.495
.092
-2.413
29.079
A2
48.333
7.495
.000
32.587
64.079
A1
A3
61.667
7.495
.000
45.921
77.413
A3
-13.333
7.495
.092
-29.079
2.413
A1
A2
-61.667
7.495
.000
-77.413
-45.921
A1
-36.667
7.495
.000
-52.413
-20.921
2.20
A2
A3
7.105E-15
7.495
1.000
-15.746
15.746
A2
36.667
7.495
.000
20.921
52.413
A1
A3
36.667
7.495
.000
20.921
52.413
A3
-7.105E-15
7.495
1.000
-15.746
15.746
A1
A2
-36.667
7.495
.000
-52.413
-20.921
A1
8.333
7.495
.281
-7.413
24.079
2.70
A2
A3
40.000
7.495
.000
24.254
55.746
A2
-8.333
7.495
.281
-24.079
7.413
A1
A3
31.667
7.495
.001
15.921
47.413
A3
-40.000
7.495
.000
-55.746
-24.254
A1
A2
-31.667
7.495
.001
-47.413
-15.921
Se basa en medias marginales estimadas
. La diferencia de medias es significativa en el nivel .05.
b. Ajuste para varias comparaciones: menor diferencia significativa (equivalente a sin ajustes).

Estadstica Aplicada

Pgina 90

Tema 5 Anlisis de Regresin y Correlacin


Lineal Simple
El anlisis de regresin lineal, es una tcnica que permite estudiar la relacin funcional entre
dos o ms variables cuantitativas, a travs de una ecuacin matemtica. Por su parte, el
anlisis de correlacin, investiga mide el grado de la relacin o asociacin que pudiera
existir entre dos o ms variables.

5.1. Anlisis de Regresin Lineal Simple


5.1.1 Anlisis de Regresin Lineal Simple

El anlisis de regresin lineal simple, utiliza la ecuacin de una lnea recta para describir la
relacin funcional entre dos variables cuantitativas (regresin de Y sobre X). La ecuacin de
regresin estimada puede usarse para predecir valores de la variable Y, cuando se conocen
valores de la variable X. El modelo de regresin lineal simple se expresa por:

yi 0 1 xi ei

i 1,2,..., n

Aqu:
yi :
Variable dependiente.
xi :

Variable independiente o predictora.

0 , 1 : Parmetros del modelo, llamados coeficientes de la ecuacin de regresin. Son


ei

conocidos como el intercepto y el coeficiente de regresin respectivamente.


: Variable aleatoria que representa el error.

Por ejemplo, si se desea estudiar la relacin funcional entre los gastos semanales en
publicidad (en $) y las ventas semanales registradas (en $).
Dnde:
Y: Venta semanal (en $)
X: Gasto semanal en publicidad (en $)
yi 0 1 xi ei
La ecuacin de regresin estimada, podra responder las siguientes preguntas:
1. Cul ser el valor de las ventas, por cada dlar que se gaste en la semana en publicidad?
Estadstica Aplicada

Pgina 91

2. Cul ser la venta promedio semanal, dado un gasto en publicidad de $45?


3. Cul ser la venta de la prxima semana, si gasto en publicidad es $50?

Supuestos del modelo de regresin.

Los errores o residuos tienen distribucin normal. Para realizar la verificacin de este
supuesto se hace uso de la prueba de bondad de ajuste de Kolmogorov Smirnov.

Los errores o residuos tienen media igual a cero y varianza igual a 2. Se obtiene la
grfica del histograma de frecuencias de los residuos en el que se muestra el valor de la
media de los residuos y su varianza.

Los errores o residuos aleatorios asociados a cualquier par de valores asociados a la


variable dependiente Y, no se encuentran autocorrelacionados. Para realizar la
verificacin de este supuesto, se utiliza la prueba de DurbinWatson
(D-W), cuyo
estadstico toma valores desde cero hasta cuatro.
Si D-W se aproxima a cero, se dice que los residuos presentan autocorrelacin
positiva.
Si D-W toma valores en el intervalo que va desde uno hasta tres, se dice que no existe
autocorrelacin entre los residuos.
Si D-W se aproxima a cuatro, se dice que los residuos presentan autocorrelacin
negativa.

El diagrama de dispersin
El primer paso en un anlisis de regresin, es construir una grfica de los datos muestrales en
un plano bidimensional y se denomina diagrama de dispersin.
El diagrama de dispersin, permite visualizar el tipo de tendencia (relacin) de la variable Y
con respecto a la variable X. Esta tendencia puede ser lineal o no lineal. En el primer caso, se
ajustar una ecuacin de una lnea recta y en el segundo caso, una curva (exponencial,
potencia, polinmica, logartmica, etc.).

Estadstica Aplicada

Pgina 92

El mtodo de los mnimos cuadrados


El mtodo de los mnimos cuadrados es el ms utilizado para ajustar la ecuacin de una lnea
recta a un conjunto de datos. La ecuacin resultante tiene dos caractersticas importantes:
1. La suma de las desviaciones verticales de los puntos con relacin a la recta es cero; y
2. La suma de los cuadrados de las desviaciones es mnima (es decir, ninguna otra recta dara
una menor suma de cuadrados de tales desviaciones)
El mtodo se basa en minimizar la suma de cuadrados de las desviaciones o residuales, esto
n

ei2

es:

i 1

( y

yi ) 2

i 1

Los valores de 0 y 1 que minimizan la suma de los cuadrados de las desviaciones, son las
soluciones de las llamadas ecuaciones normales de la recta de mnimos cuadrados:
n

n 0 1 xi
i 1
i 1

n
n

n 2

x
y

i i
0 i
1 xi
i 1
i 1
i 1

yi

Resolviendo las ecuaciones simultneas para 0 y 1 tenemos los respectivos coeficientes de


regresin estimados:

Estadstica Aplicada

Pgina 93

Ecuacin de regresin estimada


La lnea recta estimada permite obtener valores estimados o predecidos para la variable
dependiente Y, dado valores de la variable independiente X. La ecuacin estimada de la recta
ser:
y i 0 1x i

La pendiente de la recta ( 1 ). Mide el cambio que se producir en la variable


dependiente Y por un cambio unitario en la variable X. La relacin de X e Y puede ser:
Directa: 1 > 0 (pendiente positiva)
Inversa: 1 < 0 (pendiente negativa)

Intercepto ( 0 ). Es el valor de la ordenada de la recta (el valor de y cuando x = 0).

Anlisis de varianza (ANVA).


Consiste en descomponer la variabilidad total de la variable dependiente Y en dos fuentes,
debido a la regresin y debido al error o residual.

(yi y)
se
manera: (yi y) (y i y) (yi y i )
La

distancia

puede

descomponer

de

la

siguiente

Elevando al cuadrado ambos miembros y aplicando sumatorias se tiene:

Operando algebraicamente se obtiene la siguiente relacin:


n

i1

( yi y) 2

i1

i y) 2
(y

(y

i )2
y

i1

SCTotal = SCRegresin + SCError

Estadstica Aplicada

Pgina 94

Sumas de Cuadrados:

Total

Regresin

Error o residual

Cuadro del ANVA.


Permite realizar la prueba de hiptesis respecto a la existencia de la relacin lineal entre X e
Y. Las hiptesis formuladas sern:
H 0 : 1 0 (No existe relacin lineal entre X e Y) Modelo No Vlido

H1 : 1 0 (Si existe relacin lineal entre X e Y) Modelo Vlido


Fuentes de Suma de
variacin cuadrados

Grados de
libertad

Regresin

SCR

Residual

SCE

n2

Total

SCT

n1

Estadstica de prueba:
Decisin estadstica:

FC

Cuadrado medio
CMR=SCR

F calculado
Fc = CMR/CME

CME=SCE/(n-2)

CMR
CME

Se rechaza Ho, s FC F (1, n2) .

Coeficiente de determinacin y Coeficiente de no determinacin


El coeficiente de determinacin (r2), es una medida de la bondad de ajuste del modelo de
regresin para un conjunto de datos. El valor de r2 generalmente se expresa en 100%, indica el
porcentaje de la variabilidad total (variable dependiente) que es explicada por la ecuacin de
regresin ajustada.

Estadstica Aplicada

Pgina 95

El coeficiente de determinacin (r2) y coeficiente de no determinacin (1 - r2) se calculan de


la siguiente manera:

r2

SCR
SCT

siendo: 0 r 2 1;

(1 r 2 ) 1

SCR
SCT

Error estndar de la estimacin.


El error estndar de la estimacin mide la variabilidad o dispersin de los valores muestrales y
observados alrededor de la recta de regresin.

SCE
CME
n2

Se

Prueba de hiptesis sobre el coeficiente de regresin (1)


H 0 : 1 k

H 0 : 1 k

H 0 : 1 k

H1 : 1 k

H1 : 1 k

H1 : 1 k

Estadstica de prueba es:


Dnde:

1 1
~ t ( n2)
S b1

Sb1= Error estndar del coeficiente b1

Intervalo de confianza para valores predecidos


Para hallar un intervalo con un nivel de confianza del ( 1 )x100%, de los valores predecidos
para la respuesta media y para un valor individual, dado un valor de x, se utilizan las
siguientes frmulas:
1
x x
0
n
S xx

Para un valor medio:

y 0 t (

/ 2,

n2) Se

1 x x
y 0 t ( / 2, n2) Se 1 0
n
S xx

Para un valor individual:

Dnde:

0 0 1 x 0 ;
y

S xx

SCR
2
1

Estadstica Aplicada

Pgina 96

Ejemplo 20.
Un comerciante al menudeo, lleva a cabo un estudio para determinar una ecuacin que estime
sus ventas semanales en funcin de los gastos semanales de publicidad con el propsito de
predecir sus ventas para algn gasto en particular. Selecciona al azar 12 semanas y registran
los siguientes datos:
Gastos de publicidad ($)
Ventas ($)
40
500
20
400
25
395
20
365
30
475
50
510
40
490
20
420
50
560
40
525
25
420
50
525
Ajuste el conjunto de datos a un modelo (ecuacin) de regresin lineal simple
X:
Gasto semanal en publicidad (en $)
Y:
Venta semanal (en $)
1. Interprete el diagrama de dispersin.
Se puede observar que podra existir una relacin
lineal entre gasto en publicidad y ventas.

2. Verifique los supuestos del modelo de regresin.


Supuesto 1: Distribucin Normal de los Errores
o Residuos (Normalidad de los residuos).
Utilizando la prueba de bondad de ajuste de
Kolmogorov-Smirnov con un nivel de significacin
de = 0,05.
Ho: Los residuos tienen distribucin Normal
H1: Los residuos NO tienen distribucin Normal
Sig. = 0,200 > = 0,05.
Decisin: No se rechaza Ho (NRHo).
Estadstica Aplicada

Pgina 97

Conclusin: Con un nivel de significacin del 5%, se cumple el supuesto de la normalidad


de los residuos.
Otra forma
Para determinar si los residuos tienen distribucin normal, tambin existe un mtodo
grfico, pero por la subjetividad que lleva, preferimos utilizar la prueba de K-S.

En la grfica se puede
observar que la nube de
puntos se aproxima a la
recta diagonal, por lo tanto
se puede afirmar que los
residuos tienen distribucin
normal

S2: Autocorrelacin de los residuos.

1,961

Como D-W = 1,961. NO Rechazamos Ho (NRHo)


Por lo tanto, No existe autocorrelacin entre los residuos y su cumple dicho supuesto
del modelo de regresin lineal simple.
3.

Valide el modelo de regresin lineal simple con un nivel de significacin de 0.05.


Prueba F

Estadstica Aplicada

Pgina 98

Las hiptesis formuladas sern:


H 0 : 1 0

H1 : 1 0
Como Fc 64,83 F0,05;1, 10 4,96

Se Rechaza Ho.

Tambin, como Sig = 0,000 < 0,05

Se rechaza Ho.

Conclusin. Con un nivel de significacin de 0,05, se puede afirmar que existe relacin
lineal entre el gasto semanal en publicidad y las ventas. Modelo Lineal Vlido.
Tambin se puede usar la prueba T para validar el modelo

Prueba T

Formulacin de hiptesis:

H 0 : 1 0
H1 : 1 0

Prueba estadstica.
t c
T 0,025; 10 = - 2,228

1 1 4,784 0

8,051
S b1
0,594

T 0,975; 10 = 2,228. Entonces se Rechaza Ho.

Sig= 0,00 < = 0,05. Entonces se Rechaza Ho.

Estadstica Aplicada

Pgina 99

La conclusin es la misma.

Ecuacin de regresin estimada:

y i 4,784 301,954xi

0 4,7843: Si en una semana no se realiza gasto en publicidad, la venta ser de


$ 301,95.

1 301,954: Por cada dlar adicional que se asigne al gasto semanal en publicidad, la
venta se incrementa en $ 4,78.
4.

Interprete el coeficiente de determinacin.

Interpretacin. El 86,6% de la variabilidad de las ventas semanales es explicada por la


regresin sobre el gasto en publicidad.

5. Se puede asegurar a un nivel de significacin del 5%, que para cada incremento de un
dlar del gasto semanal en publicidad, las ventas semanales se incrementan en ms de
$4,0.

Ho: 1 < 4
H1: 1 > 4
= 0,05

1
t 1
~ t ( n2) ;
S b1

t c

4,784
4

1,3199 Tcrtico = T 0,05; 10gl = 1,812


0,594

Decisin: No Rechazamos Ho.

Estadstica Aplicada

Pgina 100

Conclusin. NO se puede asegurar, a un nivel de significacin del 5%, que para cada
incremento de un dlar del gasto semanal en publicidad las ventas se incrementan en ms
de $4,0.
6. Estime las Ventas semanales con un nivel de confianza del 95%, en una semana cuyo
gasto fue de 40 dlares.

1 x0 x

n
S xx

y 0 t (

/ 2,

1
n2 ) * Se *

donde:
y 0 301,954 4,78440 493,314
S xx

SCR 37576,407

1641,84785
4,7842
12

493,314 2,228x24,076 1
493,314 + 56,3632 ; luego:

T (0,025; 10=gl) = 2,228

1 40 34,1667

12
1641,84785

436,9508 < Y < 549,6772

Interpretacin. Con un nivel de confianza del 95%, se puede decir que las Ventas en una
semana en la que se destina un gasto en publicidad de 40 dlares, se encuentra entre
$436,95 y $549,68.
7. Estime las Ventas promedio con un nivel de confianza del 95%, en ciertas semanas cuyo
gasto semanal fue de 40 dlares.
1 x0 x

Se usar: y 0 t ( / 2, n2) Se
n
S xx

donde: y0 301,954 4,78440 493,314; S xx

37576,407

4,7842

1641,84785

T 0,025; 10gl = 2,228


1 40 34,16672
493,314 2,228x24,076

12
1641,84785
493,314 + 17,30366,

Luego: 476,0103 < Y < 510,6177

Interpretacin. Con un nivel de confianza del 95%, se puede decir que las Ventas promedio
en ciertas semanas en la que se destina un gasto en publicidad de 40 dlares, se encuentra
entre $476,01 y $510,62.
Estadstica Aplicada

Pgina 101

Ejercicio 24.
Una entidad estatal que se encarga de evaluar proyectos de construccin de carreteras, desea
construir un modelo lineal simple que estime el costo de la oferta ganadora de un proyecto de
carretera en funcin del nmero de licitaciones. La entidad est interesada predecir, con el
modelo hallado, el costo que podra tener la oferta ganadora si se presenta una cantidad
determinada de postores a la licitacin. Para el estudio se extrae una muestra de 15 proyectos,
cuyos datos se presentan en el siguiente cuadro.

Proyectos
Nmero
licitaciones

de

10

11

12

13

14

15

10

10

11

8,0

9,7

7,8

7,7

5,5

8,3

5,5

10,3

8,0

8,8

9,4

8,6

8,1

7,8

Oferta ganadora
5,1
(millones $)

Suponiendo que se cumplen los supuestos, ajuste el conjunto de datos a una regresin lineal
simple. A continuacin se presenta las salidas del SPSS.
X:
Y:

Nmero de licitaciones
Oferta ganadora (millones $)

Estadstica Aplicada

Pgina 102

1.

Interprete el diagrama de dispersin para el conjunto de datos.

2.

Escriba la ecuacin de regresin e interprete el coeficiente de regresin.

3.

Con un nivel de significacin de 0,05 valide el modelo de regresin.

Estadstica Aplicada

Pgina 103

4.

Qu porcentaje de la variacin de los montos de la oferta ganadora no es explicada


por el modelo?

5.

Pronostique e interprete, con un nivel de confianza del 95%, el monto de la oferta


ganadora si el nmero de licitaciones presentadas es 6.

Ejercicio 25.
La empresa Grupo-XYZ, produce partes para camin que utilizan en los remolques. La
gerencia de produccin desea desarrollar un modelo de regresin que le permita predecir los
costos de produccin (miles de dlares) en funcin de las unidades producidas (en cientos).
Los datos se muestran en la siguiente tabla.

Estadstica Aplicada

Unidades producidas
(cientos)

Costos
(miles $)

12,3

6,2

8,3

5,3

Pgina 104

6,5

4,1

4,8

4,4

6,6

5,2

4,6

4,8

9,6

5,9

6,5

4,2

1. Escriba la ecuacin de regresin lineal estimada e interprete el coeficiente de regresin.

Estadstica Aplicada

Pgina 105

Ecuacin de regresin estimada:

y i

2. Verifique los supuestos del modelo de regresin.


-

Normalidad de los residuos.


Sig. =
Conclusin:

Autocorrelacin de los residuos.


D-W =
Conclusin:

3. Con un nivel de significacin de 0,05 valide el modelo de regresin.

4. Qu porcentaje de la variacin de los costos de produccin se puede atribuir a la


regresin sobre las unidades producidas?

Estadstica Aplicada

Pgina 106

5. Estime e interprete con un nivel de confianza del 95% el costo promedio de


produccin, cuando se producen 800 unidades.

6. Se puede asegurar a un nivel de significacin del 5%, que por cada incremento de un
ciento de unidades producidas, el costo de produccin se incrementa en ms de $ 213.

5.1.2 Anlisis de Correlacin Lineal Simple.


El anlisis de correlacin lineal simple, permite estudiar el grado de relacin lineal existente
entre dos variables cuantitativa. Es til en un trabajo exploratorio cuando el investigador
desea encontrar el grado o la fuerza de esa relacin (cuantificar o medir el grado de la
relacin).
El coeficiente de correlacin expresa el grado de asociacin lineal que existe entre dos
variables X e Y, donde el coeficiente de correlacin poblacional se denota por xy vara
Estadstica Aplicada

Pgina 107

dentro del intervalo de -1 y 1. Esta medida no es afectada por las unidades de medicin de las
variables.
Si 0 entonces indicar que no existe correlacin o asociacin entre las variables, mientras
que cuando se acerca a 1 o a -1 indicar que existe una asociacin positiva o negativa fuerte, y
cuando es exactamente 1 -1 la asociacin entre las variables es perfecta.

Estimacin del coeficiente de correlacin


El estimador de se denota por r y se calcula mediante la siguiente frmula:
r=
r 1 Correlacion o relacion negativaentre x e y

Si r 0 No existe correlacion o relacion entre x e y


r 1 Correlacion o relacion positivaentre x e y

Inferencia sobre el coeficiente de correlacin


H0 : 0

Para probar las hiptesis:

H1 : 0

El estadstico de prueba es: t

r n2
1 r2

~ t ( n 2)

Si se asume que X e Y siguen la distribucin normal bivariada, es posible probar las


H 0 : 0

hiptesis ms generales:

H1 : 0

El estadstico de prueba es:


Z

Estadstica Aplicada

(1 r)(1 0 )
n 3
ln
~ N(0,1)
2
(1 r)(1 0 )

Pgina 108


Ejemplo 21.
Utilizando los datos de las ventas semanales y el gasto en publicidad.
1. Halle e interprete el coeficiente de correlacin simple.

r 0,866 0,931
Interpretacin. Existe una correlacin positiva entre el gasto semanal en publicidad y las
ventas semanales.
2. Con un nivel de significacin del 5%, se puede afirmar que el gasto semanal en publicidad
y las ventas estn correlacionadas.
H0 : 0
H1 : 0
El estadstico de prueba es: t

r n 2
1 r2

t c

0,931 12 2
1 0,9312

8,066

T 0,025; 10 = -2,228 y T 0,975; 10 = 2,228. Se rechaza Ho.


Conclusin. Con un nivel de significacin del 5%, se puede afirmar que el gasto semanal
en publicidad y las ventas estn correlacionados.
3. Se puede afirmar que el gasto semanal en publicidad y las ventas se correlacionan en
menos de 0,98. Utilice un nivel de significacin del 5%.
H0: >0,98
H1: < 0,98
= 0,05

n 3 (1 r )(1 0 )
Z
ln
~ N (0,1)
2
(1 r)(1 0 )

12 3 (1 0,931)(1 0,98)
ln
Zc
1,8951
2
(1 0,931)(1 0,98)

Z crtico = Z 0,05 = - Z 0,95 = - 1,645


Como Z exp < Z crtico

Rechazamos Ho.

Conclusin. SI se puede afirmar que el gasto semanal en publicidad y las ventas se


correlacionan en menos de 0,98.
Estadstica Aplicada

Pgina 109

Ejercicio 26.
Una empresa en consultora contable, desea desarrollar un modelo que le permita predecir
el costo de la auditora en funcin de la cantidad de documentos revisados. Para este fin
extrae una muestra de 12 auditoras, registrando el costo de la auditora (miles $) y el
nmero de documentos revisados (miles documentos).
Cantidad de
documentos (miles )

28

17

32

48

14

19

24

34

22

20

46

Costo de la auditora
(miles $)

50

35

65

98

12

24

38

45

65

45

36

85

A continuacin se muestra las salidas del anlisis de regresin lineal simple con el SPSS.

a) Suponiendo que se cumplen los supuestos, escriba la ecuacin de regresin lineal


simple e interprete los coeficientes de regresin.

Estadstica Aplicada

Pgina 110

b) Pruebe con un nivel de significacin de 5%, si existe relacin lineal entre el nmero de
documentos revisados y el costo.

c) Se puede afirmar con un nivel de confianza del 2%, que por cada mil documentos que
se revisen el costo de la auditora aumenta en ms de 1700 dlares.

d) Estime con un nivel de confianza del 95%, el costo promedio de la auditora cuando se
revisen 25,000 documentos.

e) Pruebe si existe correlacin entre la cantidad (el nmero) de documentos revisados y


el costo de la audiencia. Use un = 0,05

Estadstica Aplicada

Pgina 111

Ejercicios propuestos 5.
37. Las materias primas empleadas en la produccin de una fibra sinttica son almacenadas
en un lugar donde no se tiene control sobre la humedad. Las mediciones de la humedad
relativa en el lugar de almacenamiento (X) y la humedad de una muestra de las materias
primas (Y) (ambas en porcentaje) para 12 das se presenta en la siguiente tabla.
Humedad en el
almacenamiento (%)

42

35

50

43

48

62

31

36

44

39

55

48

Humedad en la materia
prima (%)

12

14

11

16

12

10

13

11

A continuacin se muestra las salidas del anlisis de regresin lineal simple con el SPSS.

Estadstica Aplicada

Pgina 112

a) Analice el diagrama de dispersin. Qu se puede afirmar acerca de la relacin entre la


humedad de almacenamiento y la humedad en la materia prima?
b) Verifique los supuestos del modelo de regresin lineal simple
c) Interprete los coeficientes de regresin. Presente la ecuacin estimada.
d) Pruebe con un nivel de significacin de 5%, si existe relacin lineal entre la humedad
de almacenamiento y la humedad en la materia prima (validez del modelo lineal).
e) Se puede afirmar con un nivel de confianza del 2%, que por cada punto porcentual de
incremento en la humedad de almacenamiento, la humedad en la materia prima
aumenta en ms de 0,2%.
f) Halle e interprete un intervalo de confianza del 95%, para la humedad de la materia
prima, cuando se tiene una humedad de almacenamiento de 45%.
g) Pruebe con un nivel de significacin de 5%, si la correlacin entre la humedad de
almacenamiento y la humedad de la materia prima es mayor a 0,85.
38. Se cuenta con informacin de una muestra de 10 fondos de inversin, respecto a su
rentabilidad porcentual para un periodo de doce meses y el activo total (en millones de $).
Los datos se presentan en la siguiente tabla.

Activo
total
(millones $)
Rentabilidad
(%)

22

18

14

26

10

16

19

20

29,3

17,6

16,0

9,5

22,6

12,4

18,5

21,4

18,2

12,5

La salida con SPSS se muestra a continuacin:

Estadstica Aplicada

Pgina 113

a) Analice el diagrama de dispersin. Qu se puede afirmar acerca de la relacin entre el


activo total y rentabilidad del fondo de inversin?
b) Verifique los supuestos del modelo de regresin lineal simple.
Estadstica Aplicada

Pgina 114

c) Interprete los coeficientes de regresin. Presente la ecuacin estimada.


d) Pruebe con un nivel de significacin de 5%, si existe relacin lineal entre el activo
total y la rentabilidad.
e) Se puede afirmar con un nivel de confianza del 5%, que por cada milln de dlares de
activo total, la rentabilidad del fondo de inversin se incrementa en ms de 0,65
millones de dlares.
f) Halle e interprete un intervalo de confianza del 95%, para la rentabilidad promedio,
cuando se tiene un activo de 18 millones de dlares.
g) Pruebe si existe correlacin entre el activo total y la rentabilidad. Use un nivel de
significacin de 5%.
39. Se desea estimar la relacin que existe entre el ingreso anual de las familias de una
determinada ciudad y sus ahorros anuales y se sugiere que la relacin es lineal. Se
registra el ingreso anual (en miles de dlares) y el ahorro anual (en ciento de dlares)
para nueve familias de dicha ciudad. A continuacin se muestran los datos y los reportes
del SPSS para realizar el anlisis respectivo.
Familia

Ingreso (miles de $)

6,9

11,3

12,8

14,4

14,5

19,5

19,2

16,9

24,5

Ahorro (ciento de $)

3,4

12,1

9,6

15,6

17,8

12,3

13,4

17,8

a.
b.
c.
d.
e.

Pruebe los supuestos del modelo al nivel de significacin del 5%.


Valide del modelo de regresin con un = 0,05
Escriba la ecuacin de regresin lineal estimada
Interprete el coeficiente de regresin.
Se considera que una ciudad se cataloga como solvente si por cada 1000 dlares de
ingreso el ahorro de las familias se incrementa en ms de 90 dlares. Con un nivel de
significacin del 5%, es posible catalogar a la ciudad como solvente?
f. Pruebe si existe correlacin entre el ingreso de las familias y su ahorro. Use un
= 0,05.
Estadstica Aplicada

Pgina 115

5.2 Regresin no lineal


Los modelos de Regresin No Lineal permiten modelar la relacin entre dos variables (X e
Y), cuando stas no se ajustan a una regresin lineal simple. Los modelos no lineales que se
estudiarn son:

Modelo
cuadrtico:

X Y y 0 1 x 2 x 2

X Y y 0e

1 x

X Y y 0 x

Modelo

exponencial:

Modelo

potencia:

Funcin exponencial
Si un conjunto de datos apareados consiste en n puntos (x i, yi) se endereza cuando se grfica
lnyi versus xi, esto indica que la media de la distribucin de y est dado por 0 e1 x . Si se toma
logaritmos a la ecuacin y 0 e1 x se convierte en:

ln y ln 0 1 x y * 0* 1 x
Las transformaciones pueden mejorar el ajuste y la capacidad de prediccin de la ecuacin de
regresin. En el siguiente cuadro se muestran las transformaciones para linealizar los modelos
no lineales.

Exponencial

y 0 e1 x

Transformacin
apropiada
y* Ln y

Potencia

y 0 x 1

y* Ln y
x* Ln x

Modelos no lineales

Cuadrtico

Funcin
linealizada
y* ln 0 1x
y* Ln 0 1 x *

X Y y 0 1 x 2 x 2

Estadstica Aplicada

Pgina 116

Validacin de los modelos. Para validar los no lineales se deben probar la significacin del
correspondiente coeficiente de regresin, se tiene el siguiente cuadro:
Modelo

Ecuacin Estimada

Cuadrtico

y 0 1 x 2 x2

Modelo Linealizado

Hiptesis Formuladas
H 0 : 0
H1: 0
2

y 0 e 1 x

Exponencial

y 0 x 1

Potencia

LnY Ln 0 1 x

LnY Ln 0 1 Lnx

H 0 :
H1:
H 0 :
H 1:

0
0
0
0

Construccin de un Intervalo de Confianza. Para hallar un intervalo de confianza del


(100-) % para un valor medio o un valor individual de Y, se tiene el siguiente cuadro:

donde:

S e CME

S xx

CM Re g
b12

Luego el intervalo de confianza para el valor medio y valor individual tanto para el modelo
exponencial o potencial es:

Valor medio:
Valor individual:
Ejemplo 22.
Los siguientes datos se refieren al porcentaje de neumticos radiales de alto rendimiento
hechos por cierto fabricante que son usables (y) despus de haber sido empleados el nmero
de millas (x).
Millas conducidas (en miles) x
1
2
5

Estadstica Aplicada

Porcentaje usable y
85,0
91,7
81,3

Lny
4,587
4,519
4,398

Pgina 117

10
20
30
40

50,0
36,4
28,0
15,0

4,159
3,595
3,484
2,839

A continuacin se muestra la salida con el SPSS,


Resumen de modelo y estimaciones de parmetro
Variable dependiente: Porcentaje usable
Resumen del modelo
Estimaciones de parmetro
Ecuacin
R cuadrado
F
df1
df2
Sig.
Constante
b1
b2
Lineal
,903
46,282
1
5
,001
85,144
-1,932
Cuadrtico
,048
,959
47,087
2
4
,002
93,349
-3,808
Potencia
,831
24,553
1
5
,004
117,891
-,441
Exponencial
,975
194,822
1
5
,000
92,440
-,044
La variable independiente es Millas conducidas (en miles)
Coeficientes

ln(Millas conducidas (en miles)


(Constante)

Coeficientes no estandarizados
B
Error estndar
-,441
,089
117,891
25,874

Coeficientes
estandarizados
Beta
-,911

t
-4,955
4,556

Sig.
,004
,006

La variable dependiente es ln(Porcentaje usable).

1.

Interprete la grfica siguiente:

Paso 1: Dar las prioridades del modelo de acuerdo al R2 ms alto.


Resumen de modelo y estimaciones de parmetro
Variable dependiente: Porcentaje usable
Resumen del modelo
Estimaciones de parmetro
Ecuacin
R cuadrado
F
df1
df2
Sig.
Constante
b1
b2
Lineal
,903
46,282
1
5
,001
85,144
-1,932
,959
47,087
2
4
,002
93,349
-3,808
,048
Cuadrtico
Potencia
,831
24,553
1
5
,004
117,891
-,441
Exponencial
,975
194,822
1
5
,000
92,440
-,044
La variable independiente es Millas conducidas (en miles)

Exponencial-Cuadrtico-Lineal-Potencia
Paso 2: Validar el modelo con prioridad uno, se debe rechazar la hiptesis nula en la prueba
para que el modelo sea vlido, si no se rechaza la hiptesis nula, el modelo no es vlido y se
validar el siguiente modelo y as sucesivamente.
Usando = 0,05, en nuestro caso validar el modelo exponencial por tener el valor de R
cuadrado ms alto:

Estadstica Aplicada

Pgina 118

Validando el modelo exponencial:


H 0 : 1 0
H1 : 1 0
t
c

11

0,044

14,667
0,003

S b1

Sig= 0,00 < = 0,05, Entonces se Rechaza H0.


Conclusin, Con un nivel de significacin del 5%, se pude afirmar que el modelo de
regresin exponencial es vlido.

2. Determine la ecuacin muestral del modelo de regresin que nos permita realizar la
estimacin de la variable dependiente.
0,044 x
Ecuacin muestral del Modelo: y 92,44 e

3. Construya e interprete un intervalo de confianza del 95% para el porcentaje promedio


usable de neumticos radiales cuando se ha conducido 10000 millas.
0,044 x
Como: y 92,44 e

X 0 10
Y0 92,44 e 0, 044(10) 59,53473 ln(59,53473) 4,08656
t0.025;5 2,57058;
Sxx

Se 0,014 0,11832;

2,671
1379,64876
0,0442

IC (

Y .X

) 4,08656

IC ( Y . X ) 4,08656

X 15,4286

1 (10 15,4286)2

2,57058 0,11832
7
1379,64876
0,12326

3,96330 ln( Y . X ) 4,20981


e3,96330 Y . X e4, 20981

52,63097 Y . X 67,34407

Interpretacin, Con un nivel de confianza del 95%, se estima que el porcentaje


promedio usable de neumticos radiales cuando se ha conducido 12000 millas est en el
intervalo [58,98717; 132,66139]

Ejemplo 23.
Se desea determinar una ecuacin de regresin lineal que estime el volumen de ventas de
medicamentos elaborados con receta en funcin del porcentaje de ingredientes utilizados para
su elaboracin. Se tiene datos de una muestra de 12 farmacias mostrados en el siguiente
cuadro:
Volumen de ventas
(miles $)
% de ingredientes

32

30

800

36

900

40

100

50

300

600

200

400

12

10

26

14

26

16

20

18

23

25

22

24

Estadstica Aplicada

Pgina 119

X:

Y:

% de ingredientes;

Volumen de ventas (miles $)

A continuacin se muestra el reporte del SPSS.

Resumen de modelo y estimaciones de parmetro


Variable dependiente: Volumen de ventas en miles de $
Resumen del modelo
Ecuacin
Lineal

Estimaciones de parmetro

R cuadrado

df1

df2

Sig.

Constante

b1

,693

22,536

10

,001

-635,455

47,091

Cuadrtico

,941

71,383

,000

1442,818

-199,102

Potencia

,837

51,228

10

,000

,002

3,797

Exponencial

,916

109,658

10

,000

1,609

,228

b2

6,651

La variable independiente es Porcentaje de ingredientes.

Resumen del modelo


R cuadrado
R cuadrado
ajustado
,941
,928

R
,970

Error estndar de
la estimacin
85,269

La variable independiente es Porcentaje de ingredientes


ANOVA

Regresin
Residuo
Total

Suma de
cuadrados
1038037,034

gl
2

Media
cuadrtica
519018,517

65437,632

7270,848

1103474,667

11

F
71,383

Sig.
,000

La variable independiente es Porcentaje de ingredientes


Coeficientes

Porcentaje de ingredientes
Porcentaje de ingredientes ** 2
(Constante)

Coeficientes no estandarizados
B
Error estndar
-199,102
40,387
6,651
1,084
1442,818
351,421

1. Interprete el diagrama de
dispersin.

Coeficientes
estandarizados
Beta
-3,519
4,379

t
-4,930
6,136
4,106

Sig.
,001
,000
,003

1000

2. Determine el mejor modelo usando un


nivel de significacin de 0,05.

Volumen de ventas (miles $)

800

600

400

200

Validando el modelo cuadrtico:


y 0 1 x 2 x 2
H 0 : 2 0
H1 : 2 0
2 6,651
tc 2

6,136
Sb 2
1,084
Sig= 0,000 < = 0,05. Entonces se Rechaza
Estadstica Inferencial

10

15

20

25

30

Porcentaje de ingredientes

Pgina 120

Conclusin: Con un nivel de significacin de 0,05, se pude afirmar que el modelo de


regresin cuadrtico es vlido.
3. Determine la ecuacin muestral del modelo de regresin que nos permita realizar la
estimacin de la variable dependiente.
y 1442,818 199,102x 6,651x 2
Ejemplo 24.
El siguiente conjunto de datos corresponden a los impuestos recaudados y la poblacin
que posee de una muestra de 10 localidades de una regin.
Impuestos recaudados
(miles de soles)
76,579
0,600
137,927
137,927
21,035
3,000
103,219
4,768
0,250
182,808
76,579

Poblacin (miles
de habitantes)
3,3
2,0
3,5
3,5
2,9
2,3
3,4
2,5
1,8
3,6
3,3

X: Poblacin (miles),
Y:
A continuacin se muestra la salida con el SPSS

Impuestos (miles soles)

Resumen de modelo y estimaciones de parmetro


Variable dependiente: Impuestos recaudados (miles de soles)
Resumen del modelo

Estimaciones de parmetro

Ecuacin
R cuadrado

df1

df2

Sig.

Constante

b1

b2

Lineal

,795

35,009

,000

-194,813

89,957

Cuadrtico

,965

111,010

,000

513,562

-458,337

Potencia

,999

6940,895

,000

,001

9,530

Exponencial

,994

1378,150

,000

,001

3,582

100,093

La variable independiente es Poblacin (miles de habitantes)

ANOVA

Regresin
Residuo
Total

Suma de cuadrados

gl

Media cuadrtica

Sig.

55,682

55,682

6940,895

,000

,072

,008

55,754

10

La variable independiente es Poblacin (miles de habitantes)


Coeficientes

Coeficientes no estandarizados

Estadstica Aplicada

Coeficientes
estandarizados

Sig.

Pgina 121

B
ln(Poblacin (miles de habitantes)

Error estndar
9,530

,114

,001

,000

(Constante)

Beta
,999

83,312

,000

8,161

,000

La variable dependiente es ln(Impuestos recaudados (miles de soles)

1. Interprete el diagrama de dispersin.

2. Determine la ecuacin de regresin vlida usando un nivel de significacin de 0,05.


Validando el modelo potencia.

y 0 x 1

Lny 0 1Lnx

y 0 1x

H 0 : 1 0
H1 : 1 0
tc

11
Sb1

9,530
83,596
0,114

Sig. = 0,000 < = 0,05. Entonces se Rechaza H0.


Conclusin: Con un nivel de significacin de 0,05; se pude afirmar que el modelo
de regresin potencia es vlido.
9,530
Ecuacin muestral del modelo: y 0,001x

Estadstica Aplicada

Pgina 122

3. Con un nivel de confianza del 95% construya un intervalo para el valor del impuesto a
recaudar para una poblacin de tres mil habitantes.
X0 3

ln(3) 1,09861

Y 0,001 39,53 35,23429


t ( 0, 025;
Sxx

9)

2,26216;

ln(35,23429) 3,56209

Se 0,008 0,08944;

55,682
0,61309
9,5302

IC (Y ) 3,56209

ln X 1,04481

2,26216 0,08944 1

1
(1,09861 1,04481) 2

11
0,61309

IC (Y ) 3,56209 1,04672 2,51537 Ln(Y ) 4,60881

e 2,51537 Y e 4,60881

12,37119 Y 100,36464

Existe un 95% de confianza de que el intervalo [12,37119; 100,36464] contenga el valor del
impuesto a recaudar en una poblacin de tres mil habitantes.

Ejercicio 27.
El gerente de una distribuidora de gaseosas desea mejorar su sistema de reparto a un sector de
minoristas, El gerente est interesado en predecir el tiempo que demora un reparto en funcin del
nmero de cajas a repartir, Para tal efecto selecciona una muestra de 10 pedidos, mostrando los
datos en el siguiente cuadro.
Nmero de
cajas (decenas)
5
8
10
15
16
12
4
24
14
20

Tiempo de reparto
(minutos)
12
16
20
22
35
28
10
55
30
50

Variable dependiente: Tiempo de reparto (minutos)


Resumen del modelo
Ecuacin

Estimaciones de parmetro

R cuadrado

df1

df2

Sig.

Constante

b1

Lineal

,919

90,751

,000

-1,616

2,298

Cuadrtico

,935

50,600

,000

5,396

1,001

Potencia

,926

99,696

,000

2,486

,942

Exponencial

,931

108,095

,000

8,033

b2

,048

,086

La variable independiente es Nmero de cajas (decenas).

Estadstica Aplicada

Pgina 123

Lineal
Resumen del modelo
R

R cuadrado

R cuadrado ajustado

Error estndar de la estimacin

,959

,919

,909

4,600

La variable independiente es Nmero de cajas (decenas)


ANOVA
Suma de cuadrados

gl

Media cuadrtica

Sig.

Regresin

1920,317

1920,317

90,751

,000

Residuo

169,283

21,160

Total

2089,600

La variable independiente es Nmero de cajas (decenas)

Coeficientes

Coeficientes
Coeficientes no estandarizados

estandarizados

Error estndar

Beta

Sig.

Nmero de cajas (decenas)

2,298

,241

,959

9,526

,000

(Constante)

-1,616

3,413

-,473

,649

Cuadrtico
Resumen del modelo
R

R cuadrado

R cuadrado ajustado

Error estndar de la estimacin

,967

,935

,917

4,395

La variable independiente es Nmero de cajas (decenas)


ANOVA
Suma de

Media

cuadrados

gl

cuadrtica

Sig.

Regresin

1954,413

977,206

50,600

,000

Residuo

135,187

19,312

Total

2089,600

La variable independiente es Nmero de cajas (decenas)


Coeficientes
Coeficientes no

Coeficientes

estandarizados

estandarizados

Error estndar

Beta

Sig.

Nmero de cajas (decenas)

1,001

1,003

,417

,997

,352

Nmero de cajas (decenas)** 2

,048

,036

,556

1,329

,226

(Constante)

5,396

6,204

,870

,413

Estadstica Aplicada

Pgina 124

Universidad de Ciencias Aplicadas

2015-2

Potencia
Resumen del modelo

R cuadrado
,962

R cuadrado

Error estndar

ajustado

de la estimacin

,926

,916

,164

La variable independiente es Nmero de cajas (decenas).


ANOVA
Suma de

Media

cuadrados
Regresin

cuadrtica

2,679

2,679

,215

,027

2,894

Residuo
Total

gl

Sig.

99,696

,000

La variable independiente es Nmero de cajas (decenas)


Coeficientes
Coeficientes
Coeficientes no estandarizados
B

estandarizados

Error estndar

Beta

Sig.

ln(Nmero de cajas
,942

,094

2,486

,581

,962

9,985

,000

4,280

,003

(decenas)
(Constante)

La variable dependiente es ln(Tiempo de reparto (minutos)

Exponencial
Resumen del modelo
R cuadrado

Error estndar de la

R cuadrado

ajustado

estimacin

,965

,931

,922

,158

La variable independiente es Nmero de cajas (decenas).


ANOVA
Suma de cuadrados

gl

Media cuadrtica

Sig.

Regresin

2,694

2,694

108,095

,000

Residuo

,199

,025

Total

2,894

La variable independiente es Nmero de cajas (decenas)


Coeficientes
Coeficientes
Coeficientes no estandarizados
B
Nmero de cajas (decenas)
(Constante)

Error estndar
,086

,008

8,033

,941

estandarizados
Beta

t
,965

Sig.

10,397

,000

8,536

,000

La variable dependiente es ln(Tiempo de reparto (minutos)

Estadstica Aplicada

Pgina 125

Universidad de Ciencias Aplicadas

2015-2

1. Apoye al gerente a decidir cul sera el mejor modelo de regresin que se ajusta a los
datos, valide el mejor modelo y presente la ecuacin de regresin del modelo vlido,
Use un = 0,05.

2. Construya e interprete un intervalo de confianza del 95% para estimar el tiempo

promedio que demora un reparto cuando el pedido tiene 120 cajas (usar cuatro
decimales).

Estadstica Aplicada

Pgina 126

Universidad de Ciencias Aplicadas

2015-2

Ejercicio 28.
El gerente de una empresa especializada en ofrecer consultora en sistemas contables, desea
desarrollar un modelo que le permita predecir el costo de la auditora en funcin del nmero
de documentos revisados. Para este fin extrae una muestra de ocho auditoras, registrando
el costo de la auditora (miles de nuevos soles) y el nmero de documentos revisados (miles
de documentos), Los datos se presentan en el siguiente cuadro.
Nmero de documentos
(miles de documentos)
Costo de la auditora (miles
de nuevos soles)

12

13

28

25

10

18

22

30

24

Resumen de modelo y estimaciones de parmetro


Variable dependiente: Costo de auditora (miles de nuevos soles) Y
Resumen del modelo
Ecuacin

Estimaciones de parmetro

R cuadrado

df1

df2

Sig.

Constante

b1

Lineal

,899

53,468

,000

5,046

,884

Cuadrtico

,937

36,888

,001

,551

1,799

Potencia

,927

76,195

,000

2,855

,703

Exponencial

,825

28,244

,002

6,822

,057

b2

-,029

La variable independiente es Nmero de documentos (miles).

Lineal
Resumen del modelo
R

R cuadrado

R cuadrado ajustado

Error estndar de la estimacin

,948

,899

,882

3,038

La variable independiente es Nmero de documentos (miles).


ANOVA
Suma de cuadrados

gl

Media cuadrtica

Sig.

Regresin

493,497

493,497

53,468

,000

Residuo

55,378

9,230

Total

548,875

La variable independiente es Nmero de documentos (miles).

Coeficientes
Coeficientes no estandarizados
B
Nmero de documentos (miles)
(Constante)

Estadstica Aplicada

Error estndar
,884

,121

5,046

1,829

Coeficientes estandarizados
Beta
,948

Sig.

7,312

,000

2,758

,033

Pgina 127

Universidad de Ciencias Aplicadas

2015-2

Cuadrtico
Resumen del modelo
R

R cuadrado

R cuadrado ajustado

Error estndar de la estimacin

,968

,937

,911

2,640

La variable independiente es Nmero de documentos (miles).


ANOVA
Suma de cuadrados

gl

Media cuadrtica

Sig.

Regresin

514,037

257,019

36,888

,001

Residuo

34,838

6,968

Total

548,875

La variable independiente es Nmero de documentos (miles).


Coeficientes
Coeficientes
Coeficientes no estandarizados

estandarizados

Error estndar

Beta

Sig.

Nmero de documentos (miles)

1,799

,543

1,930

3,312

,021

Nmero de documentos (miles) ** 2

-,029

,017

-1,000

-1,717

,147

(Constante)

,551

3,063

,180

,864

Potencia
Resumen del modelo
R

R cuadrado

R cuadrado ajustado

Error estndar de la estimacin

,963

,927

,915

,173

La variable independiente es Nmero de documentos (miles)


ANOVA
Suma de cuadrados

gl

Media cuadrtica

Sig.

Regresin

2,294

2,294

76,195

,000

Residuo

,181

,030

Total

2,474

La variable independiente es Nmero de documentos (miles).

Coeficientes
Coeficientes
Coeficientes no estandarizados

estandarizados

Error estndar

Beta

Sig.

ln(Nmero de documentos (miles)

,703

,081

,963

8,729

,000

(Constante)

2,855

,542

5,270

,002

La variable dependiente es ln(Costo de auditora (miles de nuevos soles).

Estadstica Aplicada

Pgina 128

Exponencial
Resumen del modelo
R
,908

R cuadrado

R cuadrado ajustado

Error estndar de la estimacin

,825

,796

,269

La variable independiente es Nmero de documentos (miles)

ANOVA
Suma de cuadrados

gl

Media cuadrtica

Sig.

Regresin

2,041

2,041

28,244

,002

Residuo

,434

,072

Total

2,474

La variable independiente es Nmero de documentos (miles).

Coeficientes
Coeficientes
Coeficientes no estandarizados

estandarizados

Error estndar

Beta

Sig.

Nmero de documentos (miles)

,057

,011

,908

5,315

,002

(Constante)

6,822

1,104

6,178

,001

La variable dependiente es ln(Costo de auditora (miles de nuevos soles).

1. Apoye al gerente a decidir cul sera el mejor modelo de regresin que se ajusta a los
datos. Valide el mejor modelo y presente la ecuacin de regresin del modelo vlido,
Use un = 0,05.

Estadstica Aplicada

Pgina 129

3. Construya e interprete un intervalo de confianza del 95% para estimar el costo


promedio de la auditora cuando se revisan 10 000 documentos (usar cuatro
decimales),

Estadstica Aplicada

Pgina 130

Ejercicios propuestos 6.
40. Un economista del Departamento de Recursos Humanos del Estado de Florida est preparando
un estudio sobre el comportamiento del consumidor. l recolect los datos que aparecen en
miles de dlares para construir una ecuacin que modele el consumo en funcin del ingreso del
consumidor.
Consumidor
Ingreso
Consumo

1
24,3
16,2

2
12,5
8,5

3
31,2
15,0

4
28,0
17,0

5
35,1
24,2

6
10,5
11,2

7
23,2
15,0

8
10,0
7,1

9
8,5
3,5

10
15,9
11,5

11
14,7
10,7

12
15,0
9,2

Resumen de modelo y estimaciones de parmetro


Variable dependiente: Consumo
Resumen del modelo
Ecuacin

Estimaciones de parmetro

R cuadrado

df1

df2

Sig.

Constante

b1

Lineal

,845

54,408

10

,000

1,778

,558

Cuadrtico

,845

24,484

,000

1,815

,554

Potencia

,789

37,494

10

,000

,789

,933

Exponencial

,721

25,904

10

,000

4,548

,047

b2

9,928E-5

La variable independiente es Ingreso.

Lineal
Resumen del modelo
R

R cuadrado

R cuadrado ajustado

Error estndar de la estimacin

,919

,845

,829

2,251

La variable independiente es Ingreso.

Estadstica Aplicada

Pgina 131

ANOVA
Suma de cuadrados

gl

Media cuadrtica

Sig.

Regresin

275,590

275,590

54,408

,000

Residuo

50,652

10

5,065

Total

326,242

11

La variable independiente es Ingreso.


Coeficientes
Coeficientes
Coeficientes no estandarizados

estandarizados

Error estndar

Beta

Sig.

Ingreso

,558

,076

,919

7,376

,000

(Constante)

1,778

1,583

1,123

,288

Cuadrtico
Resumen del modelo
R

R cuadrado

R cuadrado ajustado

Error estndar de la estimacin

,919

,845

,810

2,372

La variable independiente es Ingreso.

ANOVA
Suma de cuadrados

gl

Media cuadrtica

Sig.

Regresin

275,591

137,795

24,484

,000

Residuo

50,652

5,628

Total

326,242

11

La variable independiente es Ingreso.


Coeficientes
Coeficientes
Coeficientes no estandarizados

estandarizados

Error estndar

Beta

Sig.

,554

,505

,912

1,097

,301

Ingreso ** 2

9,928E-5

,012

,007

,008

,993

(Constante)

1,815

4,677

,388

,707

Ingreso

Potencia
Resumen del modelo
Error estndar de la
R

R cuadrado

R cuadrado ajustado

estimacin

,889

,789

,768

,241

La variable independiente es Ingreso.

Estadstica Aplicada

Pgina 132

ANOVA
Suma de cuadrados

gl

Media cuadrtica

Sig.

Regresin

2,173

2,173

37,494

,000

Residuo

,580

10

,058

Total

2,753

11

La variable independiente es Ingreso.


Coeficientes
Coeficientes
Coeficientes no estandarizados

estandarizados

Error estndar

Beta

Sig.

ln(Ingreso)

,933

,152

,889

6,123

,000

(Constante)

,789

,347

2,277

,046

La variable dependiente es ln(Consumo).

Exponencial
Resumen del modelo
R
,849

R cuadrado

R cuadrado ajustado

Error estndar de la estimacin

,721

,694

,277

La variable independiente es Ingreso.


ANOVA
Suma de cuadrados

gl

Media cuadrtica

Sig.

Regresin

1,986

1,986

25,904

,000

Residuo

,767

10

,077

Total

2,753

11

La variable independiente es Ingreso.


Coeficientes
Coeficientes
Coeficientes no estandarizados
B
Ingreso
(Constante)

estandarizados

Error estndar
,047

,009

4,548

,886

Beta

t
,849

Sig.
5,090

,000

5,135

,000

La variable dependiente es ln(Consumo).

a. Determine el mejor modelo de regresin simple,


b. Qu consumo pronosticara el modelo con 95% de confianza para alguien que gana US$
27 500?

41. El nmero de vendedores y los ingresos por ventas (en miles de soles) en una tienda para los
primeros seis meses del ao fueron los siguientes:
Nmero de vendedores
Ingreso por ventas

Estadstica Aplicada

14
17,5

22
18,5

19
18,0

35
26,0

30
25,0

44
29,5

Pgina 133

a. Halle la ecuacin de regresin de mnimos cuadrados para pronosticar los ingresos, Use un
nivel de significacin del 2,5%.
b. Estime, con un nivel de confianza del 95%, el ingreso por ventas si el nmero de
vendedores es de 25.
Resumen de modelo y estimaciones de parmetro
Variable dependiente: Ingreso por ventas
Resumen del modelo
Ecuacin

Estimaciones de parmetro

R cuadrado

df1

df2

Sig.

Constante

b1

Lineal

,953

81,684

,001

10,251

,445

Cuadrtico

,953

30,657

,010

10,480

,427

Potencia

,920

45,694

,002

4,206

,511

Exponencial

,944

67,041

,001

12,833

,020

b2

,000

La variable independiente es Nmero de vendedores.

Lineal
Resumen del modelo
R

R cuadrado

R cuadrado ajustado

Error estndar de la estimacin

,976

,953

,942

1,226

La variable independiente es Nmero de vendedores.

ANOVA
Suma de cuadrados

gl

Media cuadrtica

Sig.

Regresin

122,700

122,700

81,684

,001

Residuo

6,008

1,502

Total

128,708

La variable independiente es Nmero de vendedores.


Coeficientes
Coeficientes
Coeficientes no estandarizados
B

Error estndar

Nmero de vendedores
(Constante)

estandarizados

,445

,049

10,251

1,436

Beta

t
,976

Sig.
9,038

,001

7,138

,002

Cuadrtico
Resumen del modelo
R

R cuadrado

R cuadrado ajustado

Error estndar de la estimacin

,976

,953

,922

1,415

La variable independiente es Nmero de vendedores.


ANOVA
Suma de cuadrados

gl

Media cuadrtica

Sig.

Regresin

122,705

61,352

30,657

,010

Residuo

6,004

2,001

Total

128,708

La variable independiente es Nmero de vendedores.

Estadstica Aplicada

Pgina 134

Coeficientes
Coeficientes
Coeficientes no estandarizados

estandarizados

Error estndar

Beta

Sig.

Nmero de vendedores

,427

,380

,937

1,124

,343

Nmero de vendedores ** 2

,000

,006

,040

,048

,965

10,480

5,032

2,083

,129

Sig.

(Constante)

Potencia
Resumen del modelo
R cuadrado
R

R cuadrado

Error estndar de la estimacin


ajustado

,959

,920

,899

,071

La variable independiente es Nmero de vendedores.


ANOVA
Suma de
gl

Media cuadrtica

Sig.

45,694

,002

cuadrados
Regresin

,233

,233

Residuo

,020

,005

,253

Total

La variable independiente es Nmero de vendedores.


Coeficientes
Coeficientes
Coeficientes no estandarizados
B
ln(Nmero de vendedores)
(Constante)

estandarizados

Error estndar
,511

,076

4,206

1,035

Beta
,959

6,760

,002

4,063

,015

La variable dependiente es ln(Ingreso por ventas).

Exponencial
Resumen del modelo
R

R cuadrado

R cuadrado ajustado

Error estndar de la estimacin

,971

,944

,930

,060

La variable independiente es Nmero de vendedores.

ANOVA
Suma de cuadrados

gl

Media cuadrtica

Sig.

Regresin

,239

,239

67,041

,001

Residuo

,014

,004

Total

,253

La variable independiente es Nmero de vendedores.

Estadstica Aplicada

Pgina 135

Coeficientes
Coeficientes
Coeficientes no estandarizados

Nmero de vendedores
(Constante)

estandarizados

Error estndar

Beta

,020

,002

,971

12,833

,897

Sig.

8,188

,001

14,303

,000

La variable dependiente es ln(Ingreso por ventas).

42. En la siguiente tabla se muestra las ganancias que obtuvo la empresa DIGESI en los ltimos
11 meses as como la respectiva inversin en publicidad. El gerente de Marketing contrata a un
estudiante de la UPC para que determine el mejor modelo de regresin no lineal entre
publicidad y ganancia.
Mes

10

11

Publicidad (miles de soles)

12,00

10,00

8,00

7,00

11,00

7,50

10,50

11,20

9,00

9,50

8,90

Ganancias (miles de soles)

100,00

78,88

47,00

37,48

96,20

36,00

88,15

100,35

63,52

70,00

64,07

Los datos procesados en SPSS generan los siguientes resultados:


Resumen del modelo y estimaciones de los parmetros

Ecuacin

Resumen del modelo


R cuadrado

gl1

Estimaciones de los parmetros


gl2

Sig.

Constante

b1

Lineal

,955

345,274

,000

-68,896

14,718

Cuadrtico

,978

174,373

,000

-118,074

25,406

Potencia

,966

258,662

,000

,565

2,133

Exponencial

,947

159,279

,000

7,672

,228

b2

-,565

Lineal
Resumen del modelo
Error tpico de la
R

R cuadrado
,977

estimacin

R cuadrado corregida
,955

,952

4,019

ANOVA

Regresin
Residual
Total

Suma de
cuadrados
5577,814
145,393
5723,207

Gl
1
9
10

Media
cuadrtica
5577,814
16,155

F
345,274

Sig,
,000

Coeficientes

publicidad
(Constante)

Coeficientes no estandarizados
B
Error tpico
14,718
,792
-68,896
7,629

Estadstica Aplicada

Coeficientes estandarizados
Beta
,987

t
18,582
-9,031

Sig,
,000
,000

Pgina 136

Cuadrtico
R
,989

Resumen del modelo


R cuadrado
Error tpico de
R cuadrado
corregida
la estimacin
,978
,972
4,005
ANOVA
Suma de
cuadrados
5594,864
128,343
5723,207

Regresin
Residual
Total

Gl
2
8
10

Media
cuadrtica
2797,432
16,043

F
174,373

Sig,
,000

Coeficientes

publicidad
publicidad ** 2
(Constante)

Coeficientes
Coeficientes no estandarizados estandarizados
B
Error tpico
Beta
25,406
10,397
1,704
-,565
,548
-,719
-118,074
48,305

t
2,444
-1,031
-2,444

Sig,
,040
,333
,040

Potencia
R
,983

Resumen del modelo


R cuadrado
R cuadrado
corregida
,966
,963

Error tpico de
la estimacin
,073

ANOVA
Suma de
cuadrados
1,365
,047
1,412

Regresin
Residual
Total

Gl
1
9
10

Media
cuadrtica
1,365
,005

F
258,662

Sig,
,000

Coeficientes

ln(publicidad)
(Constante)

Coeficientes
Coeficientes no estandarizados
estandarizados
Beta
B
Error tpico
2,133
,133
,983
,565
,168

t
16,083
3,359

Sig,
,000
,008

Exponencial
R
,973

Resumen del modelo


R cuadrado
R cuadrado
corregida
,947
,941

Error tpico de
la estimacin
,092

ANOVA
Suma de
Media
cuadrados
gl
cuadrtica
Regresin
1,337
1
1,337
Residual
,076
9
,008
Total
1,412
10
La variable independiente es publicidad,

Estadstica Aplicada

F
159,279

Sig,
,000

Pgina 137

Coeficientes
Coeficientes
estandarizados

Coeficientes no estandarizados
Publicidad
(Constante)

B
,228
7,672

Error tpico
,018
1,334

t
12,621
5,751

Beta
,973

Sig,
,000
,000

a. Realice los pasos adecuados para validar y establecer el modelo adecuado. Escriba el modelo
elegido y valdelo. Asuma que los supuestos del modelo se cumplen y use un = 5%.
b. Estime con un nivel de confianza del 95% la ganancia promedio si el prximo mes se quiere
invertir en publicidad 11 500 soles.

43. El Sr, Contreras es el responsable de la calidad de los productos elaborados por Juice Light
motivo por el cual desea establecer la relacin que existe entre la ventas de promociones de
Juice Light y el nmero de ofertas.
El Sr. Contreras recoge los siguientes datos y se le pide que analice lo siguiente:
Lote
1
2
3
4
5
6
7

Nmero de Ofertas (Y)


1
2
5
10
20
30
40

Ventas en miles dlares (X)


49
46
42
32
18
16
9

Los resultados obtenidos con SPSS son mostrados a continuacin:


Resumen del modelo y estimaciones de los parmetros
Variable dependiente: Num_Ofertas_Y
Resumen del modelo
Ecuacin
Lineal

R cuadrado
,930

F
66,237

Cuadrtico

,976

Potencia
Exponencial

gl1

Estimaciones de los parmetros


gl2

Sig,
,000

Constante
42,862

b1
-,906

81,790

,001

57,338

-2,221

,847

27,781

,003

5339,117

-1,992

,939

76,382

,000

104,652

-,084

b2
,022

La variable independiente es: Ventas_X,

Lineal

Estadstica Aplicada

Pgina 138

Cuadrtico

Potencia

Exponencial

a.

Encuentre el mejor modelo vlido que estime el nmero de ofertas en funcin de las
ventas realizadas por las promociones. Use un nivel de confianza del 4%, Justifique su
respuesta mostrando todo el procedimiento.
b. Con el modelo validado, calcule un intervalo de confianza del 90% para el pronstico del
nmero de ofertas promedio con una venta de 40 mil dlares.

Estadstica Aplicada

Pgina 139

6. Regresin Lineal Mltiple


Realizar Anlisis de Regresin Mltiple es relacionar una variable respuesta (dependiente)
y con un conjunto de variables predictoras (independientes) utilizando una ecuacin
polinmica lineal. El objetivo principal es estimar el valor medio o valores particulares de y
a partir de valores especficos de las variables independientes.
El modelo de regresin lineal mltiple

Y 0 1 x1 2 x2 3 x3 ... k xk
Aqu:
Y: variable respuesta que se quiere predecir
0, 1,..., k : son las constantes (parmetros poblacionales)
x1, x2, ... , xk: son variables predictoras independientes que se miden sin error.
: es un error aleatorio para cualquier conjunto dado de valores de x1, x2,... , xk.

Coeficiente de regresin.
Los valores 0 , 1 , 2 ,..., k se conocen como coeficientes de regresin estimados.
Un coeficiente de regresin estimado especfico mide el cambio promedio en la variable
dependiente debido a un incremento de una unidad en la variable predictora relevante,
manteniendo constantes las otras variables de prediccin.

El error estndar de la estimacin


El error estndar de la estimacin mide la variabilidad, o dispersin, de los valores
muestrales y observados alrededor del plano de regresin.
Se

SCE
CME
n p

donde p es el nmero de parmetros a estimar.

Coeficiente de determinacin mltiple (R2)


El coeficiente de regresin mltiple mide el porcentaje de la variabilidad de y que se puede
explicar mediante las variables de prediccin.

Estadstica Aplicada

Pgina 140

Un valor de r2 cercano a uno significa que la ecuacin es muy exacta porque explica una
gran porcin de la variabilidad de y. Se define como: r 2 SSR
SST

Sin embargo, si se introducen excesivas variables al modelo el coeficiente de


determinacin incrementar su valor, por tal razn se suele calcular el coeficiente de
n 1
determinacin ajustado: r 2 corregido 1 (1 r 2 )

n p

Supuestos del anlisis de regresin lineal mltiple

Normalidad de los errores. (Prueba de K-S)

Independencia de los errores. (Prueba Durbin-Watson)

Multicolinealidad entre variables explicativas.

Anlisis de la Multicolinealidad
Multicolinealidad
Cuando existe multicolinealidad es difcil distinguir que cantidad del efecto observado se
debe a una variable de prediccin individual. En otras palabras, si dos variables estn
altamente correlacionadas, proporcionan casi la misma informacin en el pronstico.
Cuando dos variables tienen una alta correlacin, los coeficientes 0 , 1 , 2 ,..., k estimadores
de 0 , 1 , 2 ,... k no son confiables. La estimacin k de k puede no ser siquiera cercana al
valor de su correspondiente parmetro y en casos extremos puede incluso ser negativo cuando
debiera ser positivo.
Regla prctica para seleccionar las variables predictoras en regresin mltiple
La correlacin en valor absoluto entre dos variables predictoras debe ser menor

a la

correlacin en valor absoluto de la variable dependiente con cada una estas variables
predictoras.
Esto es,
rX Y
i
Si : rX i X j
No existe multicolinealidad entre X i y X j
rX jY
Estadstica Aplicada

Pgina 141

Las consecuencias adversas son:


1.

Las estimaciones de los coeficientes


de regresin fluctan de manera notoria de una muestra a otra.
2.
Una variable independiente que tiene
una relacin positiva con la variable dependiente puede producir un coeficiente de
regresin negativo si la correlacin con otra variable independiente es alta.
3.
Con frecuencia se usa la regresin
mltiple como una herramienta interpretativa para evaluar la importancia relativa de las
distintas variables independientes. Cuando las variables independientes se
intercorrelacionan, explican la misma varianza en el pronstico de la variable
dependiente; por esto, es difcil separar la influencia individual de cada variable
independiente cuando la multicolinealidad est presente.

Pasos para la eleccin del mejor modelo


Paso 1: Analizar la multicolinealidad entre cada par de variable predictoras

Para cualquier otro caso hay multicolinealidad entre las dos variables predictoras.
Cuando existe multicolinealidad entre dos variables estas no deben ir juntas en el modelo
Paso 2: Enumerar los posibles modelos donde no exista multicolinealidad y darle un ranking
de prioridad segn el R2 corregido ms alto.
Paso 3: Validar el modelo con prioridad uno. Si este no es vlido pasar al siguiente modelo
con la segunda prioridad, y as sucesivamente.
Para que el modelo sea vlido se debe platear las pruebas individuales para cada coeficiente y
deben rechazarse en todas.
H0 : i 0
H1 : i 0
Paso 4: Escribir el modelo y realizar el pronstico

Ejemplo 25.

Estadstica Aplicada

Pgina 142

Los directores del Banco Enigma S.A. han estado buscando los factores que influyen en la
deuda mensual en tarjetas de crdito (en decenas de dlares) que tienen sus clientes (Y). La
administracin sospecha que los siguientes son los factores principales: el sueldo mensual
(cientos de dlares), el pago por concepto de arbitrios (en decenas de dlares), y el nmero
promedio de cuotas con las que financiaron sus compras el ao pasado. Se ha recogido los
siguientes datos correspondientes a siete clientes:

Cliente Y: Deuda mensual


(decenas de
dlares)
1
3,90
2
3,30
3
3,70
4
4,90
5
4,00
6
3,90
7
3,20

X1: Sueldo
mensual (cientos
de dlares)
5,40
4,70
5,00
3,00
4,30
5,50
7,00

X2: Pago de arbitrios


(decenas de dlares)

X3: Nmero
promedio de
cuotas
6,30
4,90
5,80
6,90
6,60
5,90
6,00

2,90
5,30
4,00
4,80
4,20
2,90
2,90

Se procesaron los datos en SPSS y se obtuvo la siguiente informacin:


Correlaciones
Correlacin
Pearson

Modelo
1

(Constante)
X1
X2

Y
1,000
-,802
,227
,777

de Y
X1
X2
X3

X1
-,802
1,000
-,735
-,383

Coeficientesa
Coeficientes no
estandarizados
B
Error tp.
8,717
,813
-,632
-,447

,089
,110

X2
,227
-,735
1,000
-,197

Coeficientes
tipificados
Beta
-1,383
-,790

X3
,777
-,383
-,197
1,000

t
10,723

Sig.
,000

-7,095
-4,051

,002
,015

Solucin
Paso 1: Anlisis de Multicolinealidad

Estadstica Aplicada

Pgina 143

Variables

Correlaciones
Parciales entre las
Variables
Independientes

X1 Vs. X2

rX 1, X 2 0, 735

X1 Vs. X3

rX 1, X 3 0, 383

X2 Vs. X3

rX 2, X 3 0,197

Correlaciones Parciales
con la Variable
Dependiente
rY , X 1 0, 802
rY , X 2 0, 227
rY , X 1 0, 802
rY , X 3 0, 777
rY , X 2 0, 227
rY , X 3 0, 777

Anlisis

Si existe
multicolinealidad

No existe
multicolinealidad

No existe
multicolinealidad

Conclusin: Como |rYX2| < | r X1 X2| existe multicolinealidad entre las variables X1 y X2 y
esto significa que las variables X1 y X2 no pueden estar juntas en el modelo. Entonces los
posibles modelos son los que se presentan a continuacin:

Estadstica Aplicada

Pgina 144

Paso 2: Posibles modelos


Prioridad

Modelo

R2 Corregido

Y Vs. X1,X3

0,854

Y Vs. X2, X3

0,632

Y Vs. X1

0,572

Y Vs. X3

0.525

Y Vs. X2

-0.138

Paso 3: Validacin del Modelo: Y vs. X1, X3


Ho : 1 0

Ho : 3 0

H1 : 1 0

H1 : 3 0

= 0,05

= 0,05

sig = 0,025 < 0,05

sig = 0,031 < 0,05

Se Rechaza H0.

Se Rechaza H0.

Conclusin: Con un nivel de significacin del 5% se puede afirmar que ambas variables
contribuyen significativamente en el modelo, por lo tanto el modelo de regresin estimado
queda expresado como:
Paso 4: La ecuacin de regresin lineal mltiple es:

yi 2, 298 0, 270x1 0, 478x3


Clculo de errores
Deuda Mensual
(y)

Deuda Mensual estimada ( y )

Residual

yi 2, 298 0, 270x1 0, 478x3

(y - y )

3,90

3,8514

0,0486

3,30

3,3712

-0,0712

3,70

3,7204

-0,0204

4,90

4,7862

0,1138

4,00

4,2918

-0,2918

3,90

3,6332

0,2668

3,20

3,2760

-0,0760

Cliente

Estadstica Aplicada

Pgina 145

Ejemplo 26.
Una empresa que vende por correo suministros para computadoras personales, software y
hardware posee un almacn central para la distribucin de los productos ordenados.
Actualmente, la administracin se encuentra examinando el proceso de distribucin desde el
almacn y est interesada en estudiar los factores que afectan los costos de distribucin del
almacn.
Actualmente, un pequeo cargo por manejo se agrega a pedido, independiente de la cantidad
por la que se hizo. Se han recolectado datos correspondientes a los 24 meses anteriores y
respecto a los costos de distribucin del almacn, las ventas y el nmero de pedidos recibidos.

Costos de distribucin (miles de $) (y)


Ventas (miles de $) (x1)
Nmero de pedidos (x2)

Los datos del estudio se muestran en la tabla siguiente:


Mes Ventas(X1) N pedidos(X 2) Costo(y)
Mes Ventas(X 1) N pedidos(X2) Costo(Y)
1
386
4015
52.95
13
372
3977
62.98
2
446
3806
71.66
14
328
4428
72.30
3
512
5309
85.58
15
408
3964
58.99
4
401
4262
63.69
16
491
4582
79.38
5
457
4296
72.81
17
527
5582
94.44
6
458
4097
68.44
18
444
3450
59.74
7
301
3213
52.46
19
623
5079
90.50
8
484
4809
70.77
20
596
5735
93.24
9
517
5237
82.03
21
463
4269
69.33
10
503
4732
74.39
22
389
3708
53.71
11
535
4413
70.84
23
547
5387
89.18
12
353
2921
54.08
24
415
4161
62.98
a) Existe multicolinealidad? Justifique su respuesta.
b) Determine el mejor modelo de regresin lineal mltiple. Use un nivel de significancia del
5%
c) Estime el costo de distribucin cuando x1 = 600 y x2 = 5000
Correlations
X1
X1

Pearson Correlation

X2

,800

Sig. (2-tailed)
X2

Pearson Correlation
Sig. (2-tailed)

Pearson Correlation
Sig. (2-tailed)

,800

**

Y
**

,000

,000

,917**

,000
,843

**

,000

,843**

,000
,917

**

,000

**. Correlation is significant at the 0.01 level (2-tailed).

Estadstica Aplicada

Pgina 146

Model
R
dimension0
1
,935a
a. Predictors: (Constant), x2, x1
ANOVAb
Model

Sum of
Squares
1
Regression 3404,380
Residual
488,825
Total
3893,205
a. Predictors: (Constant), x2, x1
b. Dependent Variable: Y
Model

(Constant)
x1
x2

df

Adjusted R
Square
,862

R Square
,874

Mean
Square
2 1702,190
21
23,277
23

Coefficientsa
Unstandardized
Coefficients
B
Std. Error
-3,297
6,233
,049
,021
,012
,002

Std. Error of the


Estimate
4,82466

F
Sig.
73,126 ,000a

Standardized
Coefficients
Beta

t
-,529
,304 2,360
,674 5,223

Sig.
,602
,028
,000

a. Dependent Variable: Y
Model Summary
Model
R
R Square Adjusted R Square Std. Error of the Estimate
dimension0 1 ,843a
,711
,698
7,14740
a. Predictors: (Constant), x1
Model Summary
Model
R
R Square Adjusted R Square Std. Error of the Estimate
dimension0 1 ,917a
,841
,834
5,30228
a. Predictors: (Constant), x2

Solucin a)
Variables

Correlaciones Parciales
entre las Variables
Independientes

Correlaciones Parciales
con la Variable
Dependiente

X1 Vs. X2

rx1x2=0,800

rx1y= 0,843
rx2y= 0,917

Conclusin

No existe
multicolinealidad

Solucin b)
Prioridad
1
3
2

Modelo
Y Vs. X1,X2
Y Vs. X1
Y Vs. X2

R2 Corregido
0,862
0,698
0.834

Analizando YX1X2
Estadstica Aplicada

Pgina 147

Observamos el cuadro de coeficientes y planteamos lo siguiente:


Ho : 1 0

Ho : 2 0

H1 : 1 0

H1 : 2 0

= 0,05

= 0,05

sig = 0,028 < 0,05

sig = 0,000 < 0,05

Se Rechaza H0.

Se Rechaza H0.

Por lo tanto X1 y X2 son significativas al modelo


Finalmente podemos decir que el modelo es:
Y = -3,297 + 0,049X1 + 0,012X2
Solucin c)
Solo debemos reemplazar X1 = 600 y X2 = 5000 en la ecuacin:
Y = -3,297 + 0,049X1 + 0,012X2
Y = -3,297 + (0,049)(600) + (0,012)(5000)
Y = 86,103
Ejercicio 29.
Un director administrativo est interesado en desarrollar un sistema diseado para identificar qu
atributos personales son esenciales para avanzar gerencialmente. A quince empleados que han sido
ascendidos recientemente se les practica una serie de pruebas para determinar (x 1) sus habilidades
comunicativas; (x2) la habilidad para relacionarse con otros y (x 3) la habilidad para tomar
decisiones. A la clasificacin del trabajo de cada empleado (y) se le hace regresin sobre estas tres
variables. Los datos originales son los siguientes:

80
75
84
62
92
75
63

x1
50
51
42
42
59
45
48

x2
72
74
79
71
85
73
75

x3
18
19
22
17
25
17
16

y
69
68
87
92
82
74
80
62

x1
39
40
55
48
45
45
61
59

x2
73
71
80
83
80
75
75
70

x3
19
20
30
33
20
18
20
15

a) Realice el anlisis de la multicolinealidad


b) Construya modelo de regresin. Evalelo determinando si muestra una relacin significante
Estadstica Aplicada

Pgina 148

entre la variable dependiente y las tres variables independientes.


c) Qu puede decirse sobre la significancia de cada x i?

Regresin: Y; X1; X2; X3


Resumen del modelob

Modelo
1

R
.892a

R cuadrado
.796

R cuadrado
corregida
.740

Error tp. de la
estimacin
5.176

DurbinW atson
1.841

a. Variables predictoras: (Constante), X3, X1, X2


b. Variable dependiente: Y
ANOVAb

Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
1148.581
294.752
1443.333

gl
3
11
14

Media
cuadrtica
382.860
26.796

F
14.288

Sig.
.000a

a. Variables predictoras: (Constante), X3, X1, X2


b. Variable dependiente: Y

Coeficientesa
Coeficientes
estandarizad
os

Coeficientes no
estandarizados
Modelo
1

(Constante)
X1
X2
X3

B
-39.590

Error tp.
30.353

.144
1.252
.683

.201
.494
.440

Beta
.101
.568
.342

t
-1.304

Sig.
.219

.719
2.533
1.552

.487
.028
.149

a. Variable dependiente: Y

Regresin: Y; X1; X2
Re sume n de l mode lob

Modelo
1

R
.867a

R cuadrado
.751

R cuadrado
corregida
.710

Error tp. de la
estimacin
5.472

DurbinWatson
1.874

a. Variables predictoras: (Constante), X2, X1


b. Variable dependiente: Y

ANOVAb
Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
1084.067
359.266
1443.333

gl
2
12
14

Media
cuadrtica
542.034
29.939

F
18.105

Sig.
.000a

a. Variables predictoras: (Constante), X2, X1


b. Variable dependiente: Y

Estadstica Aplicada

Pgina 149

Coeficientesa
Coeficientes
estandarizad
os

Coeficientes no
estandarizados
Modelo
1

B
-70.121
.132
1.849

(Constante)
X1
X2

Error tp.
24.429
.212
.328

Beta
.092
.839

t
-2.870
.621
5.638

Sig.
.014
.546
.000

a. Variable dependiente: Y

Regresin: Y; X1; X3
Resumen del modelob
Modelo
1

R
.823a

R cuadrado
.677

R cuadrado
corregida
.623

Error tp. de la
estimacin
6.236

DurbinWatson
1.849

a. Variables predictoras: (Constante), X3, X1


b. Variable dependiente: Y

ANOVAb

Modelo
1

Suma de
cuadrados
976.654

Regresin
Residual
Total

Media
cuadrtica
488.327

466.679

12

38.890

1443.333

14

gl

F
12.557

Sig.
.001a

a. Variables predictoras: (Constante), X3, X1


b. Variable dependiente: Y

Coeficientesa

Modelo
1

(Constante)
X1
X3

Coeficientes no
estandarizados
B
Error tp.
32.691
12.464
.240
.237
1.551
.333

Coeficientes
estandarizad
os
Beta
.169
.776

t
2.623
1.013
4.659

Sig.
.022
.331
.001

a. Variable dependiente: Y

Regresin: Y; X2; X3
Resumen del modelob
Modelo
1

R
.887a

R cuadrado
.786

R cuadrado
corregida
.751

Error tp. de la
estimacin
5.071

DurbinWatson
1.702

a. Variables predictoras: (Constante), X3, X2


b. Variable dependiente: Y

Coeficientesa
Coeficientes no
estandarizados
Modelo
1

(Constante)
X2
X3

B
-37.409
1.320
.670

Coeficientes
estandarizad
os

Error tp.
29.587
.476
.431

Beta
.599
.335

t
-1.264
2.775
1.555

Sig.
.230
.017
.146

a. Variable dependiente: Y

Regresin: Y; X1
Resumen del modelob
Modelo
1

R
.303a

R cuadrado
.092

R cuadrado
corregida
.022

Error tp. de la
estimacin
10.042

DurbinWatson
1.713

a. Variables predictoras: (Constante), X1


b. Variable dependiente: Y

Estadstica Aplicada

Pgina 150

ANOVAb

Modelo
1

Regresin

Suma de
cuadrados
132.447

Media
cuadrtica
132.447
100.837

gl

Residual

1310.887

13

Total

1443.333

14

F
1.313

Sig.
.272a

a. Variables predictoras: (Constante), X1


b. Variable dependiente: Y

Coeficientesa
Coeficientes
estandarizad
os

Coeficientes no
estandarizados
Modelo
1

(Constante)
X1

B
55.366
.431

Error tp.
18.478
.376

t
2.996
1.146

Beta
.303

Sig.
.010
.272

a. Variable dependiente: Y

Regresin: Y; X2
Resumen del modelob

Modelo
1

R
.862a

R cuadrado
.743

R cuadrado
corregida
.723

Error tp. de la
estimacin
5.341

DurbinWatson
1.768

a. Variables predictoras: (Constante), X2


b. Variable dependiente: Y

ANOVAb
Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
1072.537
370.796
1443.333

gl
1
13
14

Media
cuadrtica
1072.537
28.523

F
37.603

Sig.
.000a

a. Variables predictoras: (Constante), X2


b. Variable dependiente: Y

Coeficientesa
Coeficientes
estandarizad
os

Coeficientes no
estandarizados
Modelo
1

(Constante)
X2

B
-67.601
1.901

Error tp.
23.513
.310

t
-2.875
6.132

Beta
.862

Sig.
.013
.000

a. Variable dependiente: Y

Regresin: Y; X3
Resumen del modelob
Modelo
1

R
.806a

R cuadrado
.649

R cuadrado
corregida
.622

Error tp. de la
estimacin
6.243

DurbinWatson
1.855

a. Variables predictoras: (Constante), X3


b. Variable dependiente: Y

ANOVAb

Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
936.737

Media
cuadrtica
936.737

506.597

13

38.969

1443.333

14

gl

F
24.038

Sig.
.000a

a. Variables predictoras: (Constante), X3


b. Variable dependiente: Y

Estadstica Aplicada

Pgina 151

Coeficientesa
Coeficientes no
estandarizados
Modelo
1

(Constante)
X3

B
43.177
1.610

Error tp.
6.952
.328

Coeficientes
estandarizad
os
Beta
.806

t
6.211
4.903

Sig.
.000
.000

a. Variable dependiente: Y

Anlisis de la Multicolinealidad

Posibles modelos con sus prioridades


Modelo

Estadstica Aplicada

R2 Corregido

Prioridad

Pgina 152

Validacin del modelo

Escribir la ecuacin estimada e interpretacin de los coeficientes

Ejercicio 30.
Se desea establecer un modelo que permita evaluar la ganancia bruta (miles de dlares) en la
industria qumica, sobre la base del nmero de empleados, nmero de dividendos de acciones
comunes consecutivas pagados y el valor total del inventario al principio del ao actual (miles de
dlares). Los siguientes resultados son proporcionados por el software SPSS del anlisis de una
muestra de 16 empresas.
Correlaciones
anancmero ivid endo
ventar
Bru ta
mp lead nsecuti vInicial
C orrelaci n Gan an cia B1 ,0 0 0
,7 9 3
,6 6 7
,833
N mero de
,7 9 3 1 ,0 0 0
,6 4 5
,699
Dividendos
,6 6 7
,6 4 5
1 ,0 0 0
,620
In ven tario In ,833
,699
,620 1,000
Sig . (unilat Gan an cia B
.
,000
,002
,000
N mero de
,000
.
,003
,001
Dividendos
,002
,003
.
,005
In ven tario In ,000
,001
,005
.
N
Gan an cia B
16
16
16
16
N mero de
16
16
16
16
Dividendos
16
16
16
16
In ven tario In
16
16
16
16

Estadstica Aplicada

Pgina 153

Regresin: Y X1 X2 X3
ANOVAb
Suma de
cuadrados
45510101

Resumen del modelo

Modelo
1

R
,888a

R cuadrado
,788

R cuadrado
corregida
,735

Modelo
1

Error tp. de la
estimacin
1008,95542

a. Variables predictoras: (Constante), Inventario Inicial,


Dividendos Consecutivos, Nmero de Empleados

Regresin

Media
cuadrtica
15170034
1017991,0

gl

Residual

12215892

12

Total

57725994

15

F
14,902

Sig.
,000a

a. Variables predictoras: (Constante), Inventario Inicial, Dividendos Consecutivos,


Nmero de Empleados
b. Variablea dependiente: Ganancia Bruta
Coeficientes

Coeficientes
estandarizad
os

Coeficientes no
estandarizados
Modelo
1

B
965,281

(Constante)

Error tp.
499,750

Beta

t
1,932

Sig.
,077

Nmero de Empleados

2,865

1,583

,363

1,810

,095

Dividendos Consecutivos

6,754

10,279

,120

,657

,524

,287

,111

,505

2,586

,024

Inventario Inicial
a. Variable dependiente: Ganancia Bruta

Regresin: Y X1 X2
ANOVAb

Resumen del modelo


Modelo
1

R
,819a

R cuadrado
,670

R cuadrado
corregida
,620

Modelo
1

Error tp. de la
estimacin
1209,73686

Suma de
cuadrados
38700971
19025023
57725994

Regresin
Residual
Total

gl
2
13
15

Media
cuadrtica
19350486
1463463,3

F
13,222

Sig.
,001a

a. Variables predictoras: (Constante), Dividendos Consecutivos, Nmero de


Empleados

a. Variables predictoras: (Constante), Dividendos


Consecutivos, Nmero de Empleados

b. Variable dependiente: Ganancia Bruta

Coeficientesa

Coeficientes
estandarizad
os

Coeficientes no
estandarizados
Modelo
1

B
771,842
4,905
14,995

(Constante)
Nmero de Empleados
Dividendos Consecutivos

Error tp.
592,451
1,645
11,717

Beta
,621
,267

t
1,303
2,981
1,280

Sig.
,215
,011
,223

a. Variable dependiente: Ganancia Bruta

Regresin: Y X1 X3
Resumen del modelo

Modelo
1

R
,884a

R cuadrado
corregida
,747

R cuadrado
,781

Error tp. de la
estimacin
986,65543

a. Variables predictoras: (Constante), Inventario Inicial, Nmero


ANOVAb
de Empleados

Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
45070638
12655356
57725994

Media
cuadrtica
22535319
973488,940

gl
2
13
15

F
23,149

Sig.
,000a

a. Variables predictoras: (Constante), Inventario Inicial, Nmero de Empleados


b. Variable dependiente: Ganancia Bruta

Coeficientesa

Coeficientes no
estandarizados
Modelo
1

(Constante)
Nmero de Empleados
Inventario Inicial

B
1134,761

Error tp.
418,574

3,258

1,434

,310

,103

Coeficientes
estandarizad
os
t
2,711

Sig.
,018

,412

2,272

,041

,545

3,001

,010

Beta

a. Variable dependiente: Ganancia Bruta

Estadstica Aplicada

Pgina 154

Regresin: Y X2 X3
ANOVAb
Suma de
cuadrados
42174166
15551828
57725994

Resumen del modelo

Modelo
1

R
,855a

R cuadrado
,731

R cuadrado
corregida
,689

Modelo
1

Error tp. de la
estimacin
1093,75247

Regresin
Residual
Total

gl
2
13
15

Media
cuadrtica
21087083
1196294,5

F
17,627

Sig.
,000a

a. Variables predictoras: (Constante), Inventario Inicial, Dividendos Consecutivos

a. Variables predictoras: (Constante), Inventario Inicial,


Dividendos Consecutivos

b. Variable dependiente: Ganancia Bruta

Coeficientesa
Coeficientes
estandarizad
os

Coeficientes no
estandarizados
Modelo
1

(Constante)
Dividendos Consecutivos
Inventario Inicial

B
1197,552
13,771
,387

Error tp.
523,591
10,320
,104

t
2,287
1,334
3,711

Beta
,245
,681

Sig.
,040
,205
,003

a. Variable dependiente: Ganancia Bruta

Regresin: Y X1
ANOVAb
Resumen del modelo

Modelo
1

R
,793a

R cuadrado
,629

R cuadrado
corregida
,602

Modelo
1

Error tp. de la
estimacin
1236,98328

Suma de
cuadrados
36304207
21421787

Regresin
Residual
Total

gl
1
14

57725994

Media
cuadrtica
36304207
1530127,6

F
23,726

Sig.
,000a

F
11,231

Sig.
,005a

15

a. Variables predictoras: (Constante), Nmero de Empleados

a. Variables predictoras: (Constante), Nmero de Empleados

b. Variable dependiente: Ganancia Bruta

Coeficientesa

Coeficientes no
estandarizados
Modelo
1

(Constante)

B
1150,725

Error tp.
524,730

6,263

1,286

Nmero de Empleados

Coeficientes
estandarizad
os
Beta
,793

t
2,193

Sig.
,046

4,871

,000

a. Variable dependiente: Ganancia Bruta

Regresin: Y X2
ANOVAb
Resumen del modelo

Modelo
1

R
,667a

R cuadrado
,445

R cuadrado
corregida
,405

Modelo
1

Error tp. de la
estimacin
1512,57913

a. Variables predictoras: (Constante), Dividendos


Consecutivos

Suma de
cuadrados
25695455
32030539
57725994

Regresin
Residual
Total

gl
1
14
15

Media
cuadrtica
25695455
2287895,6

a. Variables predictoras: (Constante), Dividendos Consecutivos


b. Variable dependiente: Ganancia Bruta

Coeficientesa
Coeficientes no
estandarizados
Modelo
1

(Constante)
Dividendos Consecutivos

B
1147,159
37,523

Coeficientes
estandarizad
os

Error tp.
723,845
11,197

Beta
,667

t
1,585
3,351

Sig.
,135
,005

a. Variable dependiente: Ganancia Bruta

Regresin: Y X3
Resumen del modelo

Modelo
1

R
,833a

R cuadrado
,694

R cuadrado
corregida
,672

Error tp. de la
estimacin
1123,83378

a. Variables predictoras: (Constante), Inventario Inicial

Estadstica Aplicada

Pgina 155

ANOVAb
Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
40043961
17682033
57725994

gl
1
14
15

Media
cuadrtica
40043961
1263002,4

F
31,705

Sig.
,000a

a. Variables predictoras: (Constante), Inventario Inicial


b. Variable dependiente: Ganancia Bruta

Coeficientesa
Coeficientes no
estandarizados
Modelo
1

(Constante)
Inventario Inicial

B
1676,020
,474

Coeficientes
estandarizad
os

Error tp.
392,047
,084

Beta
,833

t
4,275
5,631

Sig.
,001
,000

a. Variable dependiente: Ganancia Bruta

a. Analice la presencia de multicolinealidad en el modelo.


b. Determine e interprete el mejor modelo de regresin, use un nivel de significacin del 5%.
Anlisis de la Multicolinealidad

Posibles modelos con sus prioridades


Modelo

Estadstica Aplicada

R2 Corregido

Prioridad

Pgina 156

Validacin del modelo

Escribir la ecuacin estimada e interpretacin de los coeficientes

Estadstica Aplicada

Pgina 159

Ejercicios propuestos 7.
44. En la Facultad de Negocios Internacionales de la Universidad Particular UPS se
quiere entender los factores de aprendizaje de los alumnos que cursan la asignatura de
Estadstica Experimental, para lo cual se escoge al azar una muestra de 15 alumnos y ellos
registran notas promedios en las asignaturas de Matemtica Bsica, Nivelacin de
Matemticas y Estadstica Aplicada a los Negocios como se muestran en el siguiente cuadro:

Alumno
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Estadstica
Experimental
13
13
13
15
16
15
12
13
13
13
11
14
15
15
15

Matemtica
Bsica
15
14
16
20
18
16
13
16
15
14
12
16
17
19
13

Nivelacin de
Matemticas
15
13
13
14
18
17
15
14
14
13
12
11
16
14
15

Estadstica aplicada
a los Negocios
13
12
14
16
17
15
11
15
13
10
10
14
15
16
14

Se desea construir un modelo para determinar la dependencia que exista de aprendizaje


reflejada en las notas de la asignatura de Estadstica Experimental, conociendo las notas de las
asignaturas Matemtica Bsica, Nivelacin de matemticas y Estadstica Aplicada a los
Negocios.
Los siguientes resultados son proporcionados por el software SPSS del anlisis de una muestra
de 15 alumnos.

a. Analice la presencia de multicolinealidad en el modelo.


b. Determine e interprete el mejor modelo de regresin, use un nivel de significacin del 5%.

Estadstica Aplicada

Pgina 158

45. El director de la universidad particular UPS le interesa determinar que efecto pueden tener el
promedio de calificaciones de un egresado, el nmero de capacitaciones adicionales y
el salario inicial (miles de soles), sobre el salario final (miles de soles) despus de dos aos
de egresado. Recopil esta informacin para una muestra aleatoria de 10 egresados, los
resultados fueron los siguientes:
Graduado Sueldo Promedio de Nmero
de Sueldo
final
calificaciones capacitaciones Inicial
1
41,00
3,20
2
37,00
2
48,00
3,60
5
46,00
3
39,00
2,80
3
38,00
4
39,00
2,40
4
39,00
5
38,00
2,50
2
36,00
6
39,50
2,10
3
38,00
7
43,00
2,70
3
42,00
8
37,00
2,60
2
37,00
9
47,00
3,00
4
46,50
10
42,50
2,90
3
41,00

a. Analice la presencia de multicolinealidad en el modelo.


b. Determine e interprete el mejor modelo de regresin, use un nivel de significacin del 5%.

Estadstica Aplicada

Pgina 159

7. Series de Tiempo
Introduccin:
En el proceso de toma de decisiones a nivel individual, de empresas e instituciones pblicas,
existiendo factores o variables que afectan el resultado de la decisin, pero que estn fuera del
control del decisor. La prediccin del comportamiento futuro de estas variables se torna una
actividad crucial para la formulacin de estrategias apropiadas.
As, por ejemplo, la decisin de un individuo de seguir o no estudios de postgrado se basa
implcita o explcitamente en sus predicciones sobre oportunidades futuras en el mercado
laboral. Asimismo, una empresa tiene la necesidad de predecir sus ventas y costos futuros
para poder decidir sus niveles de produccin, inventarios, compra de materias primas,
contratacin de personal, etc. De igual manera, las instituciones pblicas basan sus polticas
en estimaciones del futuro. La poltica monetaria del Banco Central de Reserva depender de
las predicciones relacionadas con el crecimiento de la economa y futuros niveles de inflacin.
Definicin: Una serie de tiempo, tambin llamada serie cronolgica, se define como un
conjunto de valores de una variable especfica, registrados en perodos sucesivos. El patrn de
comportamiento de los datos de una serie de tiempo est determinado por la combinacin de
varios componentes. En algunas series de tiempo se puede identificar hasta cuatro diferentes
componentes: tendencia, cclica, estacional e irregularidad.
El propsito fundamental del estudio de las series de tiempo es el anlisis de los datos
histricos de una variable en un perodo determinado, para poder predecir valores futuros de
esta variable.
Componente Tendencia
La tendencia secular de una serie de tiempo es la componente a largo plazo que representa el
crecimiento o disminucin de la serie durante un perodo largo.
Las fuerzas bsicas responsables de la tendencia de una serie son poblacin, crecimiento,
inflacin de precios, cambios tecnolgicos e incrementos de la productividad.

Estadstica Aplicada

Pgina 160

Componente Cclica
Son llamados tambin ciclos econmicos y muestran las variaciones en perodos de mediano
plazo.
Para estudiar los ciclos se requiere informacin de por lo menos 15 a 20 aos.
El estudio de los ciclos ha sido descartado por ciertos autores que consideran que dicho
componente puede ser asimilado por el componente de tendencia.

Componente estacional
Son fluctuaciones de una serie de tiempo en perodos relativamente cortos que se repiten de
manera casi irregular. Por lo general estn asociados a los diferentes meses del ao.
El estudio de la variacin estacional permite encontrar ndices mediante los cuales se puede
desestacionalizar la serie.

Componente irregular
Son variaciones aleatorias que ocurren en una serie por acontecimientos inesperados, por
ejemplo a causa de: huelgas, corte de energa elctrica, desastres naturales, terrorismo, etc.
Pero tambin con la misma naturaleza aleatoria de la variable.
Estadstica Aplicada

Pgina 161

7.1 Medicin del error en el pronstico


Para calcular el error o residual de cada periodo de pronstico se utiliza:

ei Yt Y

ei : Error de pronstico en periodo t


Yt : Valor real en el periodo t

Y : Valor del pronstico en el periodo t


Desviacin Absoluta de la Media (DAM)
La DAM resulta de gran utilidad cuando el analista desea medir el error de pronstico
en las mismas unidades de la serie original.

DAM

i 1

Error Medio Cuadrado (EMC)


El EMC se usa para comparar mtodos diferentes de pronstico. Penaliza los errores
grandes del pronstico.
n
2

i1Yi Y

EMC
n
Porcentaje de Error Medio Absoluto (PEMA)
El PEMA se usa para comparar mtodos diferentes de pronstico. Indica que tan grande
son los errores del pronstico. Contrasta con los valores reales de la serie.

PEMA

Estadstica Aplicada

Yi Y

i 1

Yt
n
Pgina 162

Porcentaje Medio de Error (PME)


El PME indica cun desviada est la tcnica de pronstico usada.
Si tiende a cero no hay sesgo
Si es negativo grande el pronstico ser sobreestimado
Si es positivo grande el pronstico ser subestimado.

n i

Yt
PME i 1
n

Ejercicio 31.
El registro mensual de la venta de cacahuates (miles de toneladas) de una cierta empresa
se presenta en la tabla siguiente:
Meses
Ventas (Y)

Enero
88

Febrero
80

Marzo
84

Abril
80

Mayo
89

Para realizar el pronstico para el mes de Junio, se han llevado a cabo tres mtodos, pero
el gerente de la empresa no sabe que mtodo elegir de tal manera que pueda obtener
pronsticos confiables.
Los resultados se presentan en los siguientes cuadros:
Mtodo A
Meses
Enero
Febrero
Marzo
Abril
Mayo

Ventas
88
80
84
80
89
Suma

Error

81
82
84
91

-1

Error

e /Y

-2

Mtodo B
Meses
Enero
Febrero
Marzo
Abril
Mayo

Estadstica Aplicada

Ventas
88
80
84
80
89
Suma

e /Y

83
84
79
90

Pgina 163

Mtodo C
Meses

Ventas

Enero
Febrero
Marzo
Abril
Mayo

Error

88
80
84
80
89
Suma

79
84
81
91

Mtodos de pronstico

e /Y

1
0
-2

PEMA

A
B
C
Por lo tanto el mejor mtodo de pronstico es? Por qu?

Modelo Multiplicativo
El modelo que ms se usa para la descomposicin de las series de tiempo es el modelo
multiplicativo, en el que se analiza la serie como el producto de sus componentes:
Yt Tt C t E t I t

Dnde:
Yt : Valor real de la variable de inters.
Tt : Tendencia secular

Ct : Componente cclica
Et : Componente estacional
I t : Componente irregular

En este modelo, la tendencia

es medida en las unidades de la variable analizada

Y. Por otro lado, las componentes

son medidos en trminos relativos, con

valores mayores que 1, indicando que el efecto cclico est por encima de la tendencia,
que el efecto estacional est por encima del nivel normal o promedio, o el efecto
irregular est por encima de la combinacin de los componentes tendencia, cclico y
estacional. Valores por debajo de 1 para
indican niveles por debajo de los
promedios del respectivo componente.

Estadstica Aplicada

Pgina 164

7.2 Tcnicas de prediccin


7.2.1 Prediccin de tendencia
Esta tcnica supone que la serie de tiempo muestra nicamente una tendencia secular y no
variaciones cclicas ni estacionales, y es especialmente til cuando se analizan series de
tiempo de observaciones anuales. Consiste en ajustar una lnea de tendencia a las
observaciones pasadas, y luego proyectar esa lnea para estimar valores futuros.
Recta de Tendencia.
El mtodo y procedimiento que se usa para encontrar la lnea recta que mejor se ajusta a los
datos observados de la serie de tiempo es el de mnimos cuadrados.
Para el anlisis, Y es la variable que se est analizando y T es un valor codificado que se
usa para representar el ao, trimestre o mes segn el perodo especificado.
Ejemplo 27.
SERIE SIN ESTACIONALIDAD (SOLO TENDENCIA)
El registro anual de la venta de aspiradoras de una marca especfica en el perodo 2005 2014
se presenta en la tabla siguiente:

a.
b.

Ao

2005

2006

2007

2008

2009

2010

2011

2012

2013

2014

Ventas(Y)

2592

2748

2360

2576

2963

3395

3200

3082

3396

3781

Realizar el diagrama de dispersin y comente que componente/es se puede/en observar.


Presente la ecuacin que estime la tendencia. (Para validar utilizar
)

c. Pronosticar la venta de aspiradoras para el ao 2015.


Solucin:
a) Realizar el diagrama de dispersin reemplazando los aos por t, el cual estar en el eje
X y comente que componente/es se puede/en observar.
t
Ventas(Y)

10

2592

2748

2360

2576

2963

3395

3200

3082

3396

3781

b) Presente la ecuacin que estime la tendencia. (Para validar los modelos utilizar

e identificar el mejor modelo (lineal, cuadrtico, potencia o exponencial) que se ajusta al


Estadstica Aplicada

Pgina 165

conjunto de observaciones. Los resultados obtenidos con el paquete SPSS, se muestran a


continuacin:
Resumen de modelo y estimaciones de parmetro
Variable dependiente: Ventas
Resumen del modelo
Ecuacin

R cuadrado

Estimaciones de parmetro

df1

df2

Sig.

Constante

b1

Lineal

,758

25,005

,001

2304,267

128,188

Cuadrtico

,780

12,444

,005

2497,933

31,355

Potencia

,594

11,727

,009

2353,186

,156

Exponencial

,748

23,720

,001

2359,426

,042

b2

8,803

La variable independiente es Tiempo (aos).

Modelo Cuadrtico
Resumen del modelo
R

R cuadrado

,883

R cuadrado

Error estndar de

ajustado

la estimacin

,780

,718

236,887

La variable independiente es Tiempo (aos).


Coeficientes
Coeficientes no

Coeficientes

estandarizados

estandarizados

B
Tiempo (aos)

Beta

Sig.

31,355

116,361

,213

,269

,795

8,803

10,309

,675

,854

,421

2497,933

278,615

8,966

,000

Tiempo (aos) ** 2
(Constante)

Error estndar

Modelo Lineal
Resumen del modelo
R

R cuadrado
,870

R cuadrado

Error estndar

ajustado

de la estimacin

,758

,727

232,842

La variable independiente es Tiempo (aos).


Coeficientes
Coeficientes
Coeficientes no estandarizados
B
Tiempo (aos)
(Constante)

Estadstica Aplicada

Error estndar

128,188

25,635

2304,267

159,061

estandarizados
Beta

t
,870

Sig.

5,000

,001

14,487

,000

Pgina 166

Por lo tanto el modelo estimado es:

c) Pronosticar la venta de aspiradoras para el ao 2015.


Ecuacin de tendencia
Ao

Tiempo (t)

Yt
2015

7.2.2 Mtodo de descomposicin de una serie de tiempo


Yt Tt Et

Estadstica Aplicada

Pgina 167

Datos estacionales
Los datos de series de tiempo mensual o trimestral son de uso comn en los negocios, porque
generalmente usan tcnicas contables basados en meses o trimestres. Las proyecciones a
futuro de series de tiempo mensual y/o trimestral son actividades comunes en las
organizaciones.
La descomposicin de una serie de tiempo mensual o trimestral puede revelar la componente
estacional e irregular, adems de las componentes de tendencia y cclica. Al examinar cada
una de estas cuatro componentes por separado se puede descubrir informacin interesante y
til que permita al analista combinar estos elementos para realizar un buen pronstico.
Ejemplos de series estacionales:
1.
2.
3.
4.

Gasto de tiles escolares.


Gasto en la compra de abrigo en pocas de invierno.
Consumo de bebidas gaseosas en pocas de verano.
Consumo de champagne por fiestas navideas.

Los pronsticos que usan series de tiempo mensual o trimestral se hacen por lo general para 1
a 12 meses o para 1 a 4 trimestres futuros.
El analista debe tener de 4 a 7 aos de datos mensuales o trimestrales para realizar
clculos necesarios para la estacionalidad.
Ejemplo 1
El directorio de una compaa de aire acondicionado y de calefaccin est examinado los
datos correspondientes a los ingresos trimestrales (miles de dlares). Los datos son los
siguientes:
Ao
2010
2011
2012
2013
2014
Estadstica Aplicada

Trimestre
II
III

34
36
40
42

45
46
47
49

53
51
53
55

IV
27
33
34
35
34
Pgina 168

Sea Y ingresos; es decir, es el valor real de los ingresos de la compaa.

a.
b.
c.
d.

Qu componente/es se puede/en observar en la serie de tiempo?


Calcule los ndices estacionales usando un promedio mvil centrado de 4 trimestres.
Encuentre la serie desestacionalizada.
Presente el modelo que estime la tendencia. (Para validar utilizar
)

e.

Estime el ingreso de la compaa para los tres primeros trimestres del ao 2015.

Solucin:
a.

Qu componente (es) se puede (en) observar en la siguiente grfica?

b. Calcule los ndices estacionales usando un promedio mvil centrado de 4 trimestres.


Calcule el promedio mvil de cuatro trimestres.
IMPORTANTE: Cuando el periodo es PAR (por ejemplo 4 trimestres), el promedio
mvil lo ubicamos en la posicin 3.
AOS

Trimestres

Estadstica Aplicada

Promedio Mvil
Pgina 169

(4 trimestres)
2010

2011

2012

2013

2014

IV

27

34

II

45

III

53

=(27+34+45+53)/4 = 39,75000

IV

33

=(34+45+53)+33/4 = 41,25000

36

=(45+53+33+36)/4 = 41,75000

II

46

42,00000

III

51

41,50000

IV

34

10

40

II

11

47

III

12

53

IV

13

35

43,75000

14

42

44,25000

II

15

49

44,75000

III

16

55

45,25000

IV

17

34

45,00000

Ahora calcule el promedio mvil centrado.


IMPORTANTE: este paso se realiza solo cuando se usa promedios mviles en una cantidad
PAR de periodos, porque si fuera IMPAR, los promedios mviles ya estaran centrados.
Promedio
Mvil
(4 trimestres)

Promedio Mvil
Centrado

AOS

Trimestres

2010

IV

27

34

II

45

39,75000

(39,75000+41,25000)/2=
40,50000

III

53

41,25000

(41,25000+41,75000)/2=
41,50000

2011

Estadstica Aplicada

Pgina 170

IV

33

41,75000

41,87500

36

42,00000

41,75000

II

46

III

51

IV

34

10

40

43,25000

II

11

47

43,62500

III

12

53

44,00000

IV

13

35

44,25000

44,50000

14

42

44,75000

45,00000

II

15

49

45,25000

45,12500

III

16

55

45,00000

IV

17

34

2012

2013

2014

Calcule el cociente del valor real con respecto al valor del promedio mvil centrado
para cada trimestre de la serie temporal.

AOS Trimestres

2010

Promedio
Mvil
(4 trimestres)

Promedio
Mvil
Centrado
(P.M.C)

(Y/P.M.C)

IV

27

34

II

45

39,75000

40,50000

(45/40,50)=1,11111

III

53

41,25000

41,50000

(53/41,50)=1,27711

IV

33

41,75000

41,87500

0,78806

36

42,00000

41,75000

0,86228

II

46

41,50000

41,62500

1,10511

III

51

41,75000

42,25000

1,20710

IV

34

42,75000

42,87500

0,79300

10

40

43,00000

43,25000

0,92486

II

11

47

43,50000

43,62500

III

12

53

43,75000

44,00000

IV

13

35

44,25000

44,50000

14

42

44,75000

45,00000

II

15

49

45,25000

45,12500

III

16

55

45,00000

2011

2012

2013

2014

Estadstica Aplicada

1,08587

Pgina 171

IV

17

34

Reunir los valores reales con respecto a los valores de promedio mvil centrado que
se encuentran en la ltima columna de la tabla anterior.
Observe que el nmero 1,11111 est a la altura del II TRIMESTRE del
ao 2011, es por esa razn que el llenado del cuadro se inicia desde all y
termina en el II TRIMESTRE del ao 2014.

Ao

Trimestre
I

II

III

IV

2011
2012

1,11111 1,27711
0,86228 1,10511

2013

1,20455

2014

0,93333

Promedio

0,90682

0,78806
0,79300

=4,02046

1,22958

Un ltimo ajuste es necesario para obtener los factores de estacionalidad. El modelo


multiplicativo requiere que el factor de estacionalidad promedio sea igual a 1,00; es decir, que
la suma de los cuatro factores debe ser igual a 4,00.
Ahora para ajustar los ndices se necesita la constante de ajuste y sta se obtiene de la
siguiente manera:
Porque los datos

En nuestro ejemplo, las observaciones son por trimestre.

han sido
recolectados
trimestralmente.

Reemplazando:
Constante de Ajuste

4
0, 99491
4, 02046

Clculo de los ndices estacionales


Trimestre

Promedio X cte. De
ajuste

I
II
III

0,99491
1,09486 0,99491
0,99491
0,78919 0,99491

IV

Total de ndice estacional


Media de los ndices estacionales

Estadstica Aplicada

ndice estacional
(ajustado)
0.90221
1.22333
4
1

Pgina 172

Los ndices de estacionalidad nos brindan informacin numrica sobre la influencia de las
fluctuaciones estacionales, en nuestro ejemplo de los ingresos de la compaa.
Interpretacin de los ndices estacionales (Ajustados):
ndice estacional ajustado del tercer trimestre

IEaj(III)=1,22333
Indica que los ingresos de la compaa para este trimestre estn en un 0,22333 o 22,333% por
encima del promedio trimestral.
IEaj(I)=0,90221
Indica que los ingresos de la compaa para este trimestre estn en un 0,09779 o 9,779% por
debajo del promedio trimestral.
En conclusin:
El trimestre de menores ingresos es el cuarto trimestre, con un ndice 0,78517, lo que indica
que los ingresos para este trimestre estn en un 0,21483 o 21,483% por debajo del promedio
trimestral y el trimestre de mayores ingresos es el tercer trimestre, con un ndice 1,22333, lo
que indica que los ingresos para este trimestre estn en un 0,22333 o 22,333% por encima del
promedio trimestral.
c.

Encontrando la serie desestacionalizada

Para estimar la tendencia debemos tener los valores de la serie sin estacionalidad. Entonces, la
serie de tiempo sin la componente de estacionalidad queda de la siguiente manera.

AOS

Trimestres

2010

IV
I
II

1
2
3

27
34
45

2011
Estadstica Aplicada

ndice
Serie
estacional
desestacionalizada
ajustado
(Y/IE)
(IE)
0,78518
34,38717
0,90221
37,68540
1,08929
41,31128
Pgina 173

2012

2013

2014

III
IV
I
II
III
IV
I
II
III
IV
I

4
5
6
7
8
9
10
11
12
13
14

53
33
36
46
51
34
40
47
53
35
42

II
III
IV

15
16
17

49
55
34

1,22333
0,78518
0,90221
1,08929
1,22333
0,78518
0,90221
1,08929
1,22333
0,78518
0,90221
1,08929
1,22333

43,32448
39,90219
42,22931
43,30237
44,33577
43,32448
44,57597
44,98340
44,95937

0,78518

Graficamos la serie desestacionalizada:

Se puede observar que la serie desestacionalizada presenta una tendencia positiva, entonces
esta serie la procesamos en el SPSS, para determinar qu tipo de comportamiento presenta
(Lineal, Cuadrtico, Potencia y Exponencial), con la observacin de sus valores R2 y la
validacin de sus coeficientes respectivos, se determinar cul es el modelo que mejor se
ajusta a la serie desestacionalizada que hemos obtenido.
d.

Presente el modelo que estime la tendencia. (Para validar utilizar

Seleccionamos el modelo que presenta mayor R2, en este caso es el modelo Potencia
(R2:0.793)

Estadstica Aplicada

Pgina 174

Validar el modelo seleccionado: Potencia.


Importante: Si el modelo que present mayor R2 no es vlido, pasamos al siguiente modelo
que present mayor R2.

1. Planteamiento de hiptesis:
H0:
H1:
2. Nivel de significancia: 0,05

Estadstica Aplicada

Pgina 175

3. Decisin: Comparamos el valor de sig (0,000) y nivel de significancia


(0,05), como el sig es menor que el nivel de significancia, la decisin
es:
4. Conclusin:
Por lo tanto el modelo potencia estimado es: (Cuadro: Coeficientes - SPSS)

Reemplazando los coeficientes del modelo potencia (cuadro de coeficientes SPSS) es:

e.

Estime el ingreso de la compaa para los tres ltimos trimestres del ao 2015.

Se espera que el ingreso para el segundo trimestre del ao 2015 sea de 49,89236 mil dlares.
Ejercicio 32.
La empresa Work Gloves, revisa las ganancias trimestrales de la venta de aluminio, desde el
cuarto trimestre del ao 2011 hasta el cuarto trimestre del ao 2014, la cual se indica a
continuacin (en millones de dlares):
Trimestre

Ao
I

II

III

IV
22

2012

30

20

40

24

2013

35

26

43

28

2014

40

30

46

35

2011

Y ganancias; es decir, es el valor real de las ganancias por la venta de aluminio.


a. Calcule los ndices estacionales usando un promedio mvil de 3 trimestres.
b. Encuentre la serie desestacionalizada.
c. Presente el modelo que estime la tendencia. (Para validar utilizar
)
d. Estime el ingreso de la compaa para los tres primeros trimestres del ao 2015.

Estadstica Aplicada

Pgina 176

Solucin
a. Calcule los ndices estacionales usando un promedio mvil de 3 trimestres.
Calcule el promedio mvil de 3 trimestres.
IMPORTANTE: Cuando el periodo es IMPAR (por ejemplo 3 trimestres), el promedio
mvil queda centrado y lo ubicamos en la posicin 2.
AOS

Trimestres

2011

IV

22

30

(22+30+20)/3=24,00

II

20

(30+20+40)/3=30.00

III

40

28,00

IV

24

33,00

35

28,33

II

26

III

43

IV

28

10

40

II

11

30

38,67

III

12

46

37,00

IV

13

35

2012

2013

2014

PMC3T

Calcule el cociente del valor real con respecto al valor del promedio mvil centrado
para cada trimestre de la serie temporal.
AOS Trimestres
2011

PMC3T

Y/PMC

IV

22

30

24,00

(20/24) = 1,25000

II

20

30,00

0,66667

III

40

28,00

1,42857

IV

24

33,00

0,72727

35

28,33

1,23529

II

26

III

43

2012

2013

Estadstica Aplicada

Pgina 177

IV

28

10

40

II

11

30

III

12

46

IV

13

35

2014
37,00

1,24324

Reunir todos los cocientes de los valores reales con respecto a los valores de
promedio mvil centrado) que se encuentran en la ltima columna de la tabla
anterior.
Observe que el nmero 1,25000 est a la altura del I TRIMESTRE del ao 2012, es por esa
razn que el llenado del cuadro se inicia desde all y termina en el III TRIMESTRE del ao
2014.
Trimestre
Ao
I

II

III

IV

2012

1,25000

0,66667

1,42857

0,72727

2013

1,23529

0,75000

1,32990

0,75676

2014

1,22449

0,77586

1,24324

= 4,04336

Promedio
Ahora para ajustar los ndices se necesita la constante de ajuste y sta se obtiene de
la siguiente manera:
En nuestro ejemplo, las observaciones son por trimestre.

Reemplazando:

Clculo de los ndices estacionales


Trimestres
I

Estadstica Aplicada

(Promedio x Constante

ndice estacional

de Ajuste)

(Ajustado)

0,23659 *

1,22333

Pgina 178

II

0,73084 *

0,72301

III

1,33390 *

1,31960

IV

0,74201 *

0,73406

Total de ndices estacional

Media de los ndices estacionales

Interpretar el tercer y cuarto ndice estacional (Ajustado):

b. Serie desestacionalizada
La serie de tiempo sin la componente de estacionalidad queda de la siguiente
manera.
t

Indice
estacional
ajustado (IE)

IV

22

0,73406

(22/0,73406) = 29,97037

30

1,22333

24,52313

II

20

0,72301

27,66228

III

40

1,31960

30,31220

IV

24

0,73406

32,69495

35

1,22333

28,61032

II

26

0,72301

AOS Trimestres
2011

2012

2013
Estadstica Aplicada

Serie desestacionalizada
(Y/IE)

Pgina 179

2014

III

43

1,31960

IV

28

0,73406

10

40

1,22333

II

11

30

0,72301

III

12

46

1,31960

IV

13

35

0,73406

c. Presente el modelo que estime la tendencia. (Para validar utilizar

Lineal

Cuadrtico

Estadstica Aplicada

Pgina 180

Potencia

Exponencial

Estadstica Aplicada

Pgina 181

Por lo tanto el modelo estimado es: (Cuadro: Coeficientes - SPSS)

d. Estime el ingreso de la compaa para los tres primeros trimestres del ao 2015.

Aos

Trimestre

t
(tiempo)

Estimacin de la
tendencia (pronstico

sin estacionalidad
2015

Y t)

ndice
Estacional
Ajustado
(IE)

Pronstico

Y t IE

I
II
III

Estadstica Aplicada

Pgina 182

Se espera que el ingreso para el tercer trimestre del ao 2015 sea de


dlares,

mil

Ejercicios propuestos
46. Cars-R-Us ha reportado ventas (en US$ 1,000s) durante los aos 2009 y 2015:
Trimestre

2009

2010

2011

2012

2013

2014

2015

15,33

18,10

16,30

16,32

16,73

21,00

21,50

II

17,14

19,20

17,30

18,79

20,11

22,58

III

19,70

20,30

18,50

21,20

22,00

25,00

IV

20,20

21,50

20,30

25,14

24,81

27,20

a. Grafique los datos, e indique que componentes se aprecian.


b. Calcule los ndices estacionales (Ajustados) usando un promedio mvil de 3 trimestres.
c. Presente el modelo que estime la tendencia. (Para validar utilizar
)
d. Estime la venta para el segundo trimestre del ao 2015.
Solucin
a. Grafique los datos, e indique que componentes se aprecian.

Respuesta: Se aprecia una tendencia con pendiente positiva (al pasar los aos las
ventas aumentan) y tambin se ve el componente estacional.

Estadstica Aplicada

Pgina 183

b. Calcule los ndices estacionales (Ajustados) usando un promedio mvil de 3 trimestres.

Cte. Ajuste
Trimestre
I.E (Ajustado)

II

III

c. Presente el modelo que estime la tendencia. (Para validar utilizar

Estadstica Aplicada

IV

Pgina 184

Cuadrtico

Potencia

Estadstica Aplicada

Pgina 185

Exponencial

La ecuacin que estime la tendencia es:

d. Estime las ventas para el segundo trimestre del ao 2015.


Rspta: La venta para el segundo trimestre es: 25,58730 (en US$ 1,000s)
47. Como todos sabemos Rep Cola es la bebida gaseosa con liderazgo mundial en sus ventas,
uno de los pocos lugares donde es la excepcin es en el pas XYZ, donde la bebida Kola
Rey, ha logrado imponerse como lder, es por este motivo que Rep Cola Ca., vio la
necesidad de realizar un pronstico de su demanda en base a las ventas (en miles de
litros) realizadas en los ltimos 4 aos, utilizando el anlisis de series de tiempo. Los
datos corresponden a la informacin de las ventas trimestrales.
Trimestre

2012

2013

2014

2015

120,2

170,0

230,0

310,0

II

270,0

360,0

455,5

III

171,0

250,0

310,5

IV

216,3

355,5

400,7

a. Calcule los ndices estacionales (Ajustados) usando un promedio mvil de 3 trimestres.


b. Presente la ecuacin que estime la tendencia. (Para validar utilizar
)
c. Estime la venta para el segundo trimestre del ao 2015.
Solucin

Estadstica Aplicada

Pgina 186

a. Calcule los ndices estacionales (Ajustados) usando un promedio mvil de 3


trimestres.
Trimestre
Aos
I
II
III
IV
2012

1.44334

0.78047

1.16436

2013

0.68337

1.38462

0.77680

1.27648

2014

0.66282

1.37199

0.79841

1.17714

0.78522

1.20600

Promedio

Cte. Ajuste
I,E (Ajustado)
b. Presente el modelo que estime la tendencia. (Para validar los modelos utilizar

Lineal

Estadstica Aplicada

Pgina 187

Cuadrtico

Potencia

Exponencial

Estadstica Aplicada

Pgina 188

Rpta: El modelo que estima la tendencia es:


c. Estime la venta para el segundo trimestre del ao 2015.
Aos

Trimestre

2015

II

Tiempo

Estimacin de la
tendencia (Pronstico

ndice
Estacional

Pronstico

48. Un importante parque de diversiones tiene la siguiente cantidad de visitantes cada


trimestre desde el 2011 al 2015:

Aos

Nmero de visitantes (miles)


I

II

III

IV

2011

182

255

315

294

2012

160

250

280

297

2013

210

310

365

335

2014

225

325

384

360

2015

245

a. Mediante un promedio mvil de cuatro perodos, determine los ndices estacionales para
los trimestres y utilizando estos desestacionalice la serie de tiempo original.
b. Estime la mejor ecuacin de tendencia y pronostique el nmero de visitantes para los
tres ltimos trimestres del ao 2015.

Estadstica Aplicada

Pgina 189

Lineal

Cuadrtico

Potencia

Estadstica Aplicada

Pgina 190

Exponencial

Estadstica Aplicada

Pgina 191

8. Mtodo de Atenuacin Exponencial


8.1 TIPOS DE PRONSTICOS:
De acuerdo a Hanke y Reitsch (1996) los pronsticos se pueden clasificar en tres
principales criterios,

El primer criterio es el tiempo, es decir, existen pronsticos a corto y a largo


plazo, Estos ltimos ayudan a establecer el curso general de la organizacin en un
plazo largo de tiempo, mientras que los primeros se utilizan para disear las estrategias
que se utilizarn inmediatamente y sern ejecutadas por niveles medios en la
organizacin,
El segundo criterio se relaciona directamente con la posicin en cuanto al entorno
micro y macro, y cmo es que aqu se generan diferentes tipos de detalles en una
organizacin, Estos tipos de detalles son el micro pronstico y el macro pronstico,
Un ejemplo de micro pronstico es que el gerente de produccin sepa cuanto se
necesitar para la produccin anual de un producto determinado, mientras que un
macro detalle sera conocer el incremento en la carga tributaria (impuestos) que el
gobierno aplicar en el siguiente ao fiscal,
El tercer criterio clasifica los pronsticos en cualitativos y cuantitativos, el primero se
aplica cuando se emite el juicio de una persona, mientras que los cuantitativos se
refieren a procesos mecnicos que dan como resultado datos matemticos.

8.2. Definicin de la atenuacin exponencial


El pronstico se basa en una suma ponderada de las
observaciones pasadas, los valores dependen de los
llamados parmetros de atenuacin, una vez que se
han elegido tales parmetros, es fcil calcular los
pronsticos, el mtodo se puede adaptar fcilmente
para considerar los factores estacionales y tendencias.
Una atenuacin exponencial sobre una serie de tiempo ya atenuada con anterioridad es
llamada atenuacin exponencial doble. En algunos casos sera necesario extender este
proceso hasta una atenuacin exponencial triple.
Mientras que la atenuacin exponencial simple requiere de la condicin de
inmovilidad (estacionaria), es decir que la serie de tiempo no presenta tendencia ni
estacionalidad, la atenuacin exponencial doble podra capturar tendencias lineales, y
la atenuacin exponencial triple puede manejar casi todas las dems series de tiempo
del negocio.
Ejemplos de series estacionarias:
2.

Consumo de arroz por da.

Estadstica Aplicada

Pgina 192

3.
4.

Consumo de sal por da.


Costo promedio de los mens.

8.3 Caractersticas de la atenuacin exponencial con un


parmetro (simple)
La atenuacin exponencial es un mtodo utilizado para revisar constantemente
una estimacin a la luz de experiencias ms recientes. Se supone que la serie de
tiempo sea estacionaria.
Las observaciones se ponderan asignando pesos mayores alfa a las ms
recientes, para la siguiente *(1- ) y as sucesivamente.
El valor real de determina el grado hasta el cual la observacin ms reciente
puede influir en el valor del pronstico, es decir cuando tiende a :
1 el nuevo pronstico incluir un ajuste sustancial de cualquier error ocurrido en
el pronstico anterior,
0 el nuevo pronstico es similar al anterior

Yt 1 Yt 1 Yt
donde:
t+1 : Nuevo valor atenuado o valor de pronstico para el siguiente periodo,

: Constante de atenuacin ( 0< < 1)

Y t : Nueva observacin o valor real de la serie en el periodo t


t : Valor atenuado anterior o experiencia promedio de la serie atenuada al
periodo t-1
t = Y t para el primer perodo
La atenuacin exponencial es el pronstico anterior ms veces el error (Y t - t)
en el pronstico anterior

8.4. Seal de rastreo

Seal de Rastreo: comprende alguna medicin del error a travs del tiempo y
establece lmites, de modo que cuando el error rebase dichos lmites, se alerte
al pronosticador,

Un sistema de rastreo proporciona un mtodo para monitorear la necesidad de


cambio (actualizar alfa constante de ajuste) contiene un nivel de
variaciones permisibles entre el pronstico y los valores reales,

Si las cosas van bien, la tcnica de pronstico debera subestimar y


sobreestimar con casi la misma frecuencia.

Estadstica Aplicada

Pgina 193

donde:
CEF = Suma de los errores (valor observado menos valor pronosticado)
DAM = Es el promedio de los errores absolutos
Grfico de lmites de seal de rastreo

Ejemplo 28.
Un fabricante que se especializa en partes de reemplazos no cuenta con un sistema de
pronstico y programa la cantidad de manufactura de productos con base a las ventas (miles
de dlares), de los ltimos meses, desde junio del ao 2013 hasta Mayo del ao 2014:

Ao

Mes

ventas

Junio

350

Julio

400

Agosto

458

2013 Septiembre

2014

462

Octubre

463

Noviembre

431

Diciembre

350

Enero

380

Febrero

400

Marzo

450

Abril

480

Mayo

350

Estadstica Aplicada

Pgina 194

Utilice un modelo de atenuacin o suavizacin exponencial simple con la


constante de suavizacin: =0,6 y 0,9 y determine cul es la mejor constante
(justifique con PEMA, y Seal de rastreo).
Pronostique las ventas para el mes de junio del ao 2014.
Solucin:
Utilice un modelo de atenuacin o suavizacin exponencial simple con la
constante de suavizacin: =0,6 y 0,9 y determine cul es la mejor constante
(justifique con PEMA, y Seal de rastreo).

Constante de suavizacin:

Clculo del valor atenuado

, para:

t = 1,

Estadstica Aplicada

Pgina 195

t = 2,
t = 3,
t = 4,

t = 12,
Clculo de la medicin del error en el pronstico:

CEF (Suma de los errores)= 72,59187

DAM

PEMA

t 1

t 1

Yt
n

1,48370

Constante de suavizacin:

Mes

Ventas
(y)

VALOR
ATENUADO
( )

Error
e= y -

(Alfa=0,9)

Junio

350

350

Julio

400

350

50

50

0,12500

Agosto

458

395

63

63

0,13755

Septiembre 4

462

451,7

10,3

10,3

0,02229

463

460,97

2,03

2,03

0,00438

Octubre

Estadstica Aplicada

Pgina 196

Noviembre 6

431

462,797

-31,797

31,797

0,07377

Diciembre

350

434,17970

-84,17970

84,17970

0,24051

Enero

380

358,41797

21,58203

21,58203

0,05679

Febrero

400

377,84180

22,15820

22,15820

0,05540

Marzo

10

450

397,78418

52,21582

52,21582

0,11604

Abril

11

480

444,77842

35,22158

35,22158

0,07338

Mayo

12

350

476,47784

-126,47784

126,47784

0,36137

PRONSTICO

362,64778

Clculo del valor atenuado

, para:

t = 1,
t = 2,
t = 3,
t = 4,

t = 12,

Clculo de la medicin del error en el pronstico:

CEF (Suma de los errores)= 14,05309

DAM

PEMA

Estadstica Aplicada

t 1

t 1

Yt
n

Pgina 197

Cuadro Resumen
Alfa

Pronstico

CEF

DAM

PEMA

0,6
0,9

393,55512
362,64778

72,59187
14,05309

48,92615
45,3602

0,12125
0,11514

SEAL DE
RASTREO
1,48370
0,30981

Los dos pronsticos estn bajo control, debido a que la seal de rastreo para las
constantes de suavizacin (=0,6 y 0,9) estn dentro de los lmites [-1,5 1,5].
Ahora hay que escoger la mejor constante de suavizacin, para ello utilizamos el que
presenta menor PEMA. Por lo tanto la mejor constante es 0,9 con un PEMA de
0,10790.
Pronostique las ventas para el mes de junio del ao 2014.
El pronstico de ventas para el mes de junio del ao 2014 es de 362,64778
Ejercicio 33.
La empresa San Roque, dedicada a venta de dulces a nivel nacional e internacional, tiene
como dulce tradicional y de mayor venta al King Kong San Roque. Por tal motivo el
gerente de produccin de la empresa San Roque desea elaborar el pronstico de ventas de este
producto para tomar decisiones internas en la empresa (contratar ms personal, compra de
materia prima e insumos, elaborar un presupuesto de ventas, etc.). Para llevar a cabo el
estudio, el rea de administracin recolect las ventas en miles de dlares desde enero del ao
2013 hasta mayo del ao 2014.
Aos
Meses
Ventas

2013

Enero

88

Febrero

80

Marzo

84

Abril

80

Mayo

89

Junio

80

Julio

83

Agosto

80

Septiembre

78

Octubre

88

Estadstica Aplicada

Pgina 198

Noviembre

87

Diciembre

88

Enero

86

Febrero

84

Marzo

84

Abril

85

Mayo

84

2014

a) Complete en el cuadro los datos faltantes para hallar, el pronstico, utilice un


modelo de atenuacin exponencial simple con tres coeficientes = 0,5; 0,8 y 0,9.
Use cinco decimales.
b) Utilizando la informacin siguiente y la obtenida en la parte a, diga cul es la
mejor constante de suavizacin. Justifique su repuesta.
c) Con la mejor constante de suavizacin pronostique las ventas para el mes de Junio
del ao 2014.

Solucin:
a) Complete en el cuadro los espacios en blanco para hallar el mejor pronstico,
utilice un modelo de atenuacin exponencial simple con tres coeficientes = 0,5;
0,8 y 0,9.
Constante de suavizacin:

Meses

Ventas
(y)

VALOR
ATENUADO
( )

Error
e= y -

(Alfa=0,5)
Enero

88

88

Febrero

80

88

-8

0,1

Marzo

84

84

Abril

80

84

-4

Mayo

89

0,07865

Junio

80

85,5

5,5

0,06875

Julio

83

82,75

0,25

0,25

0,00301

Agosto

80

-2,875

2,875

Septiembre

78

81,43750

-3,43750

Octubre

10

88

79,71875

8,28125

8,28125

0,09411

Noviembre

11

87

3,14063

3,14063

0,03610

Estadstica Aplicada

0,04407

Pgina 199

2,57031

0,02921

-0,71484

0,71484

0,00831

-2,35742

2,35742

0,02806

85,17871

-1,17871

1,17871

85

84,58936

0,41064

0,41064

0,00483

84

84,79468

-0,79468

0,79468

0,00946

-8

0,1

2,4

2,4

0,02857

Diciembre

12

88

85,42969

Enero

13

86

86,71484

Febrero

14

84

Marzo

15

84

Abril

16

Mayo

17

Pronstico

Constante de suavizacin:

Meses

Ventas
(y)

VALOR
ATENUADO
( )

Error
e= y -

(Alfa=0,8)
Enero

88

88

Febrero

80

88

Marzo

84

Abril

80

83,52

-3,52

3,52

0,044

Mayo

89

80,704

8,296

8,296

0,09321

Junio

80

87,3408

-7,3408

7,3408

0,09176

Julio

83

1,53184

1,53184

0,01846

Agosto

80

82,69363

-2,69363

2,69363

0,03367

Septiembre

78

80,53873

-2,53873

2,53873

0,03255

Octubre

10

88

78,50775

9,49225

9,49225

0,10787

Noviembre

11

87

86,10155

0,89845

0,89845

0,01033

Diciembre

12

88

86,82031

1,17969

1,17969

0,01341

Enero

13

86

-1,76406

1,76406

0,02051

Febrero

14

84

86,35281

-2,35281

2,35281

0,02801

Marzo

15

84

84,47056

-0,47056

0,47056

0,00560

Estadstica Aplicada

Pgina 200

Abril

16

85

Mayo

17

84

84,81882

0,90589

0,90589

0,01066

-0,81882

0,81882

0,00975

Pronstico

Constante de suavizacin:

Meses

Ventas
(y)

VALOR
ATENUADO
( )

Error
e= y -

(Alfa=0,9)
Enero

88

Febrero

80

88

-8

0,1

Marzo

84

80,8

3,2

3,2

0,0381

Abril

80

83,68

-3,68

3,68

0,046

Mayo

89

80,368

8,632

8,632

0,09699

Junio

80

-8,13680

8,13680

0,10171

Julio

83

80,81368

2,18632

2,18632

Agosto

80

82,78137

-2,78137

2,78137

0,03477

Septiembre

78

80,27814

-2,27814

2,27814

0,02921

Octubre

10

88

78,22781

9,77219

9,77219

0,11105

Noviembre

11

87

87,02278

-0,02278

0,02278

0,00026

Diciembre

12

88

87,00228

0,99772

0,99772

0,01134

Enero

13

86

-1,90023

1,90023

0,02210

Febrero

14

84

86,19002

-2,19002

2,19002

0,02607

Marzo

15

84

84,21900

-0,21900

0,21900

0,00261

Abril

16

85

0,97810

0,97810

0,01151

Estadstica Aplicada

Pgina 201

Mayo

17

84

84,90219

-0,90219

0,01074

0,90219

Pronstico

b) Utilizando la informacin siguiente y la obtenida en la parte a, diga cul es la


mejor constante de suavizacin. Justifique su repuesta.
Alfa
Pronstico
CEF
DAM
PEMA
Seal de Rastreo
0.5

84,39734

0.8

3,15694

0,03778

-4,79529

0.9

3,49230

c) Con la mejor constante de suavizacin pronostique las ventas para el mes de Junio
del ao 2014.

Ejercicios propuestos 8.
49. Un distribuidor de acero, corta hojas de acero de bobinas suministradas por grandes
fabricantes, un pronstico exacto de utilizacin de bobinas podra ser muy til para
controlar los inventarios de materia prima, del precio de ventas, 80% es el costo de los
materiales adquiridos, aunque la determinacin de las cantidades de adquisicin implica
muchas consideraciones, se ha establecido que un modelo de atenuacin exponencial
sera de mucha utilidad para establecer un pronstico para el siguiente mes. Las tasas
actuales (de los ltimos 16 meses) de utilizacin de bobinas en libras se proporcionan a
continuacin:
Mes

Utilizacin de acero ( Lbs)

Mes

Utilizacin de acero ( Lbs)

Marzo

206807

Noviembre

658850

Abril

131075

Diciembre

179739

Mayo

124357

Enero

251969

Junio

149454

Febrero

205806

Julio

169799

Marzo

304580

Agosto

216843

Abril

293434

Septiembre

288965

Mayo

273725

Octubre

219018

Junio

Utilizando un modelo de atenuacin exponencial simple con = 0,1; 0,3; 0,5; 0,7 y
completando los siguientes cuadros:
Cuadro N 01

Estadstica Aplicada

Pgina 202

= 0,1

= 0,5

Tiempo

Meses

14

Abril

293434

15

Mayo

273725

16

Junio

Pronstico

Tiempo

Meses

244338,4518

249248,00066

14

Abrl

293434

274207,91504

15

Mayo

273725

283820,95752

16

Junio

Pronstico

= 0,3

= 0,7

Tiempo

Mes
es

14

Abril

293434

273623,9545

15

May
o

273725

16

Junio

Pronstico

Tiempo

Meses

14

Abril

293434

279995,90257

15

Mayo

273725

289402,57077

16

Junio

Pronstico

279566,96819

Cuadro N 02
Alfa

Pronstico

CEF

DAM

PEMA

0.1

448887,00595

76768,27729

0,37032

0.3

236691,25912

81098,93293

0,36103

0.5

143931,95752

88812,01712

0,36228

0.7

102316,10176

93663,95735

0,36422

Seal de
Rastreo

Determine la mejor constante de suavizacin.


Pronostique la utilizacin de acero (Lbs), para el mes de Junio del presente ao.

Resp
Determine la mejor constante de suavizacin: 0,7
Pronostique la utilizacin de acero (Lbs), para el mes de junio del presente ao:
278428,27123 libras de acero.

50. La empresa Induamrica S.A ubicada en la regin Lambayeque, requiere elaborar un


pronstico de la venta mensual para uno de sus productos de mayor demanda, el cual se
le conoce como arroz El gran chaln. Sabiendo que en los ltimos meses el rea de
Estadstica Aplicada

Pgina 203

administracin ha registrado la informacin histrica (ventas en miles de dlares), la cual


se indica en la siguiente tabla.

Meses

Ventas

Agosto

145

Septiembre

130

Octubre

135

Noviembre

135

Diciembre

140

Enero

120

Febrero

145

Marzo

150

Abril

130

Mayo

150

Utilizando un modelo de atenuacin exponencial simple con = 0,1; 0,3; 0,7 y a partir de
los siguientes cuadros:
= 0,1
Error
Meses

Tiempo

Ventas

Agosto

145

145,00000

Septiembre

130

145,00000

-15,00000

15,00000

0,11538

Octubre

135

143,50000

-8,50000

8,50000

0,06296

Noviembre

135

142,65000

-7,65000

7,65000

0,05667

Diciembre

140

141,88500

-1,88500

1,88500

0,01346

Enero

120

141,69650

-21,69650

21,69650

0,18080

Febrero

145

139,52685

5,47315

5,47315

0,03775

Marzo

150

140,07417

9,92583

9,92583

0,06617

Abril

130

141,06675

-11,06675

11,06675

0,08513

Mayo

10

150

139,96007

10,03993

10,03993

0,06693

e= y -

Pronstico

= 0,3
Estadstica Aplicada

Pgina 204

Error
e= y -

Meses

Tiempo

Ventas

Agosto

145

145,00000

Septiembre

130

145,00000

-15,00000

15,00000

0,11538

Octubre

135

140,50000

-5,50000

5,50000

0,04074

Noviembre

135

138,85000

-3,85000

3,85000

0,02852

Diciembre

140

137,69500

2,30500

2,30500

0,01646

Enero

120

138,38650

-18,38650

18,38650

0,15322

Febrero

145

132,87055

12,12945

12,12945

0,08365

Marzo

150

136,50939

13,49062

13,49062

0,08994

Abril

130

140,55657

-10,55657

10,55657

0,08120

Mayo

10

150

137,38960

12,61040

12,61040

0,08407

Pronstico

= 0,7
Error
Meses

Tiempo

Ventas

Agosto

145

145,00000

Septiembre

130

145,00000

-15,00000

15,00000

0,11538

Octubre

135

134,50000

0,50000

0,50000

0,00370

Noviembre

135

134,85000

0,15000

0,15000

0,00111

Diciembre

140

134,95500

5,04500

5,04500

0,03604

Enero

120

138,48650

-18,48650

18,48650

0,15405

Febrero

145

125,54595

19,45405

19,45405

0,13417

Marzo

150

139,16379

10,83622

10,83622

0,07224

Abril

130

146,74914

-16,74914

16,74914

0,12884

Mayo

10

150

135,02474

14,97526

14,97526

0,09984

e= y -

Pronstico

Cul es la mejor constante de suavizacin? (justifique con el PEMA y la Seal de


rastreo)
Cul es el pronstico de la venta del arroz El Gran Chaln para el mes de Junio del
ao 2014?
Rpta:
Estadstica Aplicada

Pgina 205

Cul es la mejor constante de suavizacin? (justifique con el PEMA y la Seal de


rastreo): 0,5
Cul es el pronstico de la venta del arroz El Gran Chaln para el mes de Junio del
ao 2014?: 143.36914

51. Un grupo musical vende discos compactos de sus presentaciones, en la tabla siguiente
se presentan la demanda (en cientos) de los ltimos 12 meses, el administrador del
grupo desea contar con un mtodo para pronosticar la demanda futura. Emplee el
suavizamiento exponencial con = 0,4, 0,6 y 0,8 , Con cul de estos valores de se
obtiene mejores pronsticos?

Mes

Demanda

Mes

Demanda

Junio

15

Diciembre

18

Julio

19

Enero

21

Agosto

15

Febrero

15

Septiembre

20

Marzo

17

Octubre

26

Abril

22

Noviembre

17

Mayo

17

MISCELNEA
52. Una Ca. dedicada a la venta de computadoras, est analizando las ventas efectuadas por
sus vendedores durante la ltima semana. De esta poblacin se tom una muestra
aleatoria de 100 ventas, encontrndose lo siguiente: El promedio de ventas es de $8000
con una desviacin estndar de $400.
a) Calcular el error estndar de estimacin de la media.
b) Cul es el error mximo que podra cometer a un nivel de confianza del 80%?
c) Encuentre e interprete un intervalo de confianza del 95% para estimar el monto
promedio de todas las ventas
53. Durante el verano del ao 2000 se visit a 30 restaurantes de comida rpida como
Wendys, McDonalds y Burger King (The Cincinnati Enquirer, 9 de Julio de 2000).
Durante cada visita, el cliente se dirigi al pasaje para automviles y ordeno una comida
bsica como combo o un sndwich, papas y una malteada. Se registr el tiempo (en
minutos) entre pedir y recibir la orden. Los siguientes datos son los tiempos para 30
visitas. Suponga que el tiempo sigue una distribucin normalidad.
0,9

1,0

1,2

2,2

1,9

3,6

2,8

5,2

1,8

2,1

6,8

1,3

3,0

4,5

2,8

2,3

2,7

5,7

4,8

3,5

2,6

3,3

5,0

4,0

7,2

9,1

2,8

3,6

7,3

9,0

Estadstica Aplicada

Pgina 206

a. Estime tiempo promedio en el pasaje para automviles de los restaurantes de comida


rpida.
b. Determine el intervalo de confianza de 95% para el tiempo promedio e interprete el
resultado obtenido.
c. Un gerente de un restaurante de comida rpida afirma que el tiempo promedio es de 3
minutos, basado en lo trabajado en b), usted qu opina?
54. El tiempo en horas que cada obrero de una Ca. demora en realizar una determinada tarea
sigue una distribucin normal de media y varianza igual a (0,1)2.
a) Calcular el error estndar de estimacin.
b)

Calcular el error de estimacin (E) con un nivel de confianza del 95%.

c)

Hallar el intervalo de confianza para estimar si el promedio del tiempo que 16


obreros usaron para hacer la tarea fue 1 hora. Utilice un nivel confianza del 95%.

d)

Cul debe ser el tamao de muestra a tomar si se desea estimar la media con un
error no mayor a 0,1 horas y con un nivel de confianza del 85%?

55. Para estimar la proporcin de televidentes que ve un programa, se seleccion al azar y sin
reposicin una muestra aleatoria de 400 personas, encontrndose que 120 de ellos ven
dicho programa.
a)

Cul es el error estndar de estimacin de la proporcin.


b)

Cul es el error de estimacin de la proporcin a un nivel de confianza del 90%


c)
E
ncuentre un intervalo de confianza del 95% para estimar la proporcin de todos los
televidentes que ven dicho programa.
56. En un estudio para determinar el porcentaje de aceptacin de una cerveza XYZ se ha
tomado una muestra de 500 consumidores, de los cuales 300 consumen dicha cerveza.
a) Calcular el error estndar de estimacin.
C

b)

alcular el error de estimacin, a un nivel de confianza del 99%.


c)

E
stime la proporcin poblacional de los consumidores de la cerveza XYZ mediante un
intervalo de confianza del 90%.

d)

Qu tamao de muestra se debe escoger, si se quiere que el error al estimar la


proporcin verdadera no sea mayor que 4.34%, con un nivel de confianza del 95%?

57. Despus de muchos aos de estar en funcionamiento, la Aseguradora de Fondo de


Pensiones NEPTUNO tiene actualmente muchos afiliados y el gerente debe tomar
varias decisiones sobre la base de la variabilidad de las aportaciones. Por lo tanto se toma
una muestra aleatoria de 10 afiliados y se registran los montos que aportaron el ltimo
mes, en dlares:
Estadstica Aplicada

Pgina 207

226 228 232 230 229 219 234 222 232 224
Suponga que los montos aportados por los afiliados tienen una distribucin normal,
construya un intervalo de confianza del 98% para la varianza de los montos aportados. El
gerente decidir capacitar a los vendedores para que instruyan a los afiliados sobre los
beneficios de los aportes regulares si la varianza supera los 10 dlares 2, cul ser la
decisin del gerente?
58. El administrador de una empresa financiera realiza un estudio estadstico de los ingresos
de sus clientes del sector Privado que cuentan con un crdito estudiantil. Para lo cual
selecciona una muestra aleatoria de 8 clientes con crdito estudiantil y registrndose los
ingresos en la siguiente tabla:
2312,21 2918,26 3944,24 3150,00 2852,46 2978,21 3187,66 3204,22
Construya un intervalo de confianza del 95% para la varianza de los ingresos de los
clientes con crdito estudiantil. Es posible afirmar que la variabilidad de los ingresos de
los clientes con crdito estudiantil es inferior a 500 soles?
59. La cantidad media de ingresos per cpita disponibles en Colorado es de $ 13 901 dlares
(basado en datos de la Oficina de Anlisis Econmicos de Estados unidos). Tom Phelps
planea abrir un concesionario de automviles Cadillac y quiere verificar esa cifra para
una regin especfica de Colorado, ya que en el caso que el ingreso promedio per cpita
es menor a $ 13 901 Phelps no abrira un concesionario. Phelps encuentra resultados de
una encuesta reciente de 25 personas, con una media de $ 13 447 dlares y una
desviacin estndar de $ 4 883. Al nivel de significacin del 5%, usted que le aconseja a
Tom Phelps? Tendra razn Phelps para preocuparse respecto al nivel de ingresos en
esta regin?
60. La Comisin de Defensa del Consumidor - CDC, realiza peridicamente estudios
estadsticos con el fin de comprobar las afirmaciones de los fabricantes acerca de sus
productos. Por ejemplo, la etiqueta de la lata grande de Enigma Coffee dice que contiene
800 gramos de caf. La CDC sabe que el proceso de Enigma Coffe no permite llenar las
latas exactamente con 800 gramos de caf por lata. Sin embargo, mientras la media
poblacional del peso de llenado sea por lo menos 800 gramos, los derechos del
consumidor estarn protegidos. Por esta razn, la CDC interpreta que la informacin de la
etiqueta de la lata grande tiene una media poblacional de por lo menos 800 gramos de
caf. De un lote de 2000 latas grandes de Enigma Coffee, un equipo de CDC selecciona
una muestra de 36 latas y registra el peso de caf que contiene cada una de ellas,
obteniendo un peso promedio es de 793 gramos y una desviacin estndar de 24 gramos.
Utilizando un nivel de significancia del 5%, indique si para el lote indicado, los derechos
de los consumidores de Enigma Coffee estn protegidos.
61. Despus de muchos aos de estar en funcionamiento, la Aseguradora de Fondo de
Pensiones NEPTUNO tiene actualmente muchos afiliados y el gerente debe tomar
varias decisiones sobre la base de las aportaciones promedios de las mismas. Por lo tanto
se toma una muestra aleatoria de 10 afiliados y se registran los montos que aportaron el
ltimo mes (en dlares):

Estadstica Aplicada

Pgina 208

226

228

232

230

229

219

234

222

232

224

Suponga que los montos de aportes que realizan los afiliados tienen una distribucin
normal, Usando un nivel de significacin de 2%, El gerente decidir contratar ms
vendedores, si hay evidencia que el monto promedio mensual de todos sus afiliados es
menor de 230 dlares. Cul ser la decisin del gerente?
62. Se instala una mquina Corkill para llenar botellas pequeas con 9,0 gramos de
medicamento. Se desea saber, a un nivel de significacin del 5%, si la mquina est
cumpliendo con las especificaciones respecto al contenido de cada botella y para ello se
seleccion una muestra aleatoria de 8 botellas, que proporcion los siguientes pesos en
gramos:
9,2
8,7
8,9
8,6
8,8
8,5
8,7
9,0
Si se sabe que los pesos en cada botella se distribuyen normalmente, con los resultados
que proporciona la muestra seleccionada, a qu conclusin llegara?
63. Una empresa comercializa una bebida refrescante, en un envase en cuya etiqueta se puede
leer: "Contenido 250 cc". El Departamento de defensa del consumidor toma
aleatoriamente 36 envases, y estudia el contenido medio, obteniendo una media de 234
cc. Si se sabe que la desviacin tpica poblacional es 18 cc, puede afirmarse con un 1%
de significacin que se est estafando al pblico? (Consideraremos estafa cuando el
contenido sea menor al expresado en la etiqueta).
64. Cuando funciona correctamente, un proceso produce frascos de champ cuyo contenido
pesa en promedio 200 gramos. Una muestra aleatoria de 9 frascos de un lote present los
siguientes pesos (en gramos) para el contenido:
214
197
206
208
201
197
203
209
197
Asumiendo que la distribucin de la poblacin es normal, estara usted en condiciones de
afirmar que el proceso est funcionando correctamente? Use = 5%.
65. El nuevo administrador de GYM PLUS desea comparar sus servicios con el de las
grandes cadenas de gimnasios. Un rea diferencial que suele formar cuello de botella es
el servicio de Sauna. Se extrae una muestra aleatoria de 36 clientes, del local de San
Borja, usuarios del servicio de sauna y se registra el tiempo de espera para ser atendidos.
Se obtiene un promedio de 9,24 minutos y desviacin estndar de 3 minutos. Para
sustentar las siguientes afirmaciones use Alfa=0,05.
a) El administrador de GYM PLUS afirma que el tiempo promedio de espera para ser
atendido en el Sauna es menor que 10 minutos, Esta afirmacin. Es correcta?
b) El administrador de GYM PLUS afirmar que la variabilidad del tiempo de espera para
ser atendido en el Sauna aun es alta y supera los 2 minutos, Esta afirmacin. Es
correcta?
66. El seor Standard Deviation gana un premio de lotera y decide invertir en acciones de la
empresa Enigma Comunicaciones S.A. Sin embargo, est preocupado ante el riesgo que
Estadstica Aplicada

Pgina 209

presentan estas acciones medido a travs de la varianza de su cotizacin. Sabe que las
ltimas cotizaciones diarias por accin (en nuevos soles) han sido las siguientes:
5,93

15,48

12,4

17,62

15,64

14,85

13,85

17,78

16,99

12,19

18,23

16,66

15,10

13,46

18,78

El Sr. Deviation considera aceptable una desviacin estndar de 3 nuevos soles o menor.
Suponiendo normalidad en las cotizaciones diarias y utilizando un nivel de significancia
del 10%, debera invertir el Sr. Deviation en acciones de la empresa Enigma
Comunicaciones S.A?
67. El director comercial de cierta editora de libros de educacin superior que realiza ventas
por Internet, desea precisar con mucho cuidado su poltica de crdito. El director decide
obtener una muestra aleatoria de 15 clientes, registrando las siguientes ventas al crdito
(nuevos soles). Asuma que las ventas sigue una distribucin Normal.
250 340 500 280 620 560 520 380 210 690 800 720 450 600 700

a. El Director comercial decidir promocionar las ventas al contado, si comprueba que las
ventas en promedio al crdito han superado los 450 nuevos soles. Usando un nivel de
significacin del 5%, cul ser la decisin que tomar el Director comercial?
b. El director comercial identifica que la variabilidad de las ventas al crdito puede
influenciar su poltica de crdito. El Director comercial, decidir enviar una alerta a sus
clientes, si la variabilidad de las ventas al crdito son mayores a 150 nuevos soles.
Usando un nivel de significacin del 5%, cul ser la decisin que tomar el Director
comercial?
68. Un centro de estudios de estudiantes altamente calificados, realiz un estudio para
analizar el monto en dlares, que este tipo de alumnos, haban recibido como ayuda
financiera en el transcurso de un ao. Una muestra aleatoria de 51 alumnos altamente
calificados, mostr que este monto era en promedio de $2 637,00 en un ao, con una
desviacin estndar de $617,50. Al nivel de significacin del 5%:
a. Se puede afirmar que el monto promedio de apoyo financiero que recibe este tipo de
alumno es superior a $2 500,00?
b.

Es correcto afirmar que la variabilidad de este monto es menor de $600,00?

69. Las compaas de seguros automovilsticos estn comenzando a pensar en aumentar las
tarifas para las personas que usan telfonos mientras conducen. El Nacional Consumers
Group asegura que el problema no es realmente grave porque slo el 10% de los
conductores usa telfonos. La industria de seguros realiza un estudio y encuentra que, de
500 conductores seleccionados al azar, 90 usan telfonos (basados en datos de la revista
Prevention). En el nivel de significacin del 5%, pruebe la aseveracin del grupo de
consumidores.
70. Un fabricante de papel higinico DELUXE considera que tiene asegurado ms del 20%
del mercado. Para probar esta aseveracin, la fbrica de la competencia toma una muestra
de 200 clientes potenciales a quienes les pregunta por la marca papel higinico de su
preferencia. De los 200 entrevistados, 60 prefieren el papel DELUXE. Con un nivel de
significacin del 5%, a qu conclusin se llegara respecto a la afirmacin del fabricante
de DELUXE?.
Estadstica Aplicada

Pgina 210

71. Dado el auge del ecoturismo en nuestro pas, Enigma Outfitter, tienda especializada en
materiales para excursiones (ropa, calzado y complementos) ha tenido un crecimiento
importante en los ltimos aos. Sin embargo, han surgido nuevas empresas competidoras
y Enigma Outfitter no quiere perder la iniciativa ni su posicin en el mercado. Por esta
razn, la administracin de la empresa planea una promocin con envo de cupones de
descuento para sus clientes registrados en su base de datos. La promocin ser un xito si
ms de 10% de los que reciban el cupn lo utilizan. Antes de realizar la promocin a
nivel nacional, se realiza una prueba piloto, enviando los cupones a los integrantes de una
muestra de 250 clientes, 34 de ellos utilizaron el cupn. Basndose en los resultados
obtenidos de la muestra y con un nivel de significancia del 5%, indique si, de decidir
lanzar la promocin, sta ser exitosa.
72. Se realiz una investigacin de mercadotecnia para estimar la proporcin de amas de casa
que pueden reconocer la marca de un producto de limpieza con base a la forma y color
del recipiente. De las 1 400 amas de casa, 420 fueron capaces de identificar la marca del
producto. Se puede afirmar, a un nivel de significacin del 5%, que la proporcin de
amas de casa que reconocen la marca del producto, es superior al 35%?
73. Una nueva serie de TV debe demostrar que capta ms del 25% de la audiencia despus de
su periodo inicial de 10 semanas, para decir que tuvo xito. Suponga que en una muestra
de 400 familias 112 estaban viendo la serie. A un nivel de significacin de 0,10; puede
decirse que la serie tuvo xito, con base en la informacin de la muestra?
74. Tradicionalmente el 35% de todos los prstamos otorgados a los trabajadores de una
empresa que tiene 500 empleados, han sido otorgados para capacitacin. Durante el ao
pasado la empresa ha realizado esfuerzos por incrementar esta proporcin. De una
muestra de 150 prstamos actualmente en curso, 65 han sido otorgados al personal para
capacitacin. La empresa ha tenido xito en sus esfuerzos por incrementar la proporcin
de prstamos para capacitacin? Pruebe la afirmacin usando un nivel de significacin de
4%.
75. El gerente de marketing de la empresa Cleaner Up SA propone cambiar de estrategia
publicitaria con el fin de captar ms clientes. Ha diseado un nuevo spot publicitario y ha
evaluado el impacto de ste en 360 empresas, de un total de 800 empresas del sector, de
las cuales 105 afirmaron que contrataran el servicio. La propuesta del gerente de
marketing se expondr a la junta general de accionistas si el nuevo spot publicitario
tiene un impacto mayor del 24%. Se aceptar la propuesta del gerente de marketing?.
Use un =0.02.
76. Una gran empresa de corretaje de acciones quiere determinar la eficiencia de sus nuevos
ejecutivos de cuenta en la obtencin de clientes. Luego de terminar su capacitacin, los
nuevos ejecutivos dedican varias semanas a visitar a posibles clientes para que abran
cuentas en la empresa. Los datos adjuntos contienen los nmeros de nuevas cuentas
abiertas en sus dos primeras semanas por 10 ejecutivas de cuenta seleccionadas al azar de
un total de 80 y 8 ejecutivos tambin seleccionados aleatoriamente de un total de 90.
Ejecutivas
Estadstica Aplicada

12

11

14

13

13

14

13

12

14

12
Pgina 211

Ejecutivos
13 10 11 12 13
Utilizando un nivel de significacin del 5%:

12

10

12

a. se puede afirmar que la eficiencia de cada tipo de ejecutivo, presenta la misma


variabilidad?
b.

Parece ser que las mujeres son ms eficaces en la creacin de nuevas cuentas que
los hombres?

77. Se lleva a cabo un anlisis sobre los montos de los contratos de sus clientes. Si hay
evidencia estadstica al nivel de significacin del 5% de que los montos promedios de los
contratos sufrieron una disminucin en los ltimos meses, decidir ampliar su mercado
a otros rubros. Selecciona aleatoriamente 10 contratos del ao pasado (2009)
y 10
contratos de este ao (2010) y registra los montos (miles de soles) de los contratos. En
base a estos resultados, cul ser la decisin del gerente general?
Monto
2009

6,97

4,65

12,45 10,58

7,66

12,86 11,08 11,22 10,02 10,69

Monto
2010

7,62

7,12

8,29

7,1

8,14

6,23

9,08

7,84

5,78

7,29

78. Para corroborar el resultado anterior, se selecciona aleatoriamente a 10 clientes de una


cartera de 400 clientes de los dos aos y se registran los montos de los contratos de estos
10 clientes en el 2009 y en el 2010 se corrobora la decisin anterior? Use un =0.01.
Monto
2009

10,24 9,85 8,56 11,27 7,82 5,78

7,98

9,47

10,28 8,65

Monto
2010

8,95

6,18

9,14

9,67

8,87 8,37

8,37

6,87 6,48

8,07

79. En un estudio sobre la eficacia de ciertos ejercicios para reducir peso, un grupo de 14
personas hicieron estos ejercicios durante un mes mostraron los siguientes resultados:
Persona

10

11

12

13

14

Peso antes

92

82

78

93

83

88

73

83

84

76

92

82 110 68

Peso despus

90

79

79

91

82

87

74

83

83

75

91

80 107 67

a.

Use un nivel de 0,05 de significacin para probar si el mtodo es efectivo. Indique


explcitamente las suposiciones necesarias para realizar la prueba.

b.

Use un nivel de 0,10 de significacin para probar si las varianzas de las


poblaciones son iguales. Comente los resultados.

80. Con la finalidad de promover los Aerbicos Domingueros se realiza una vez al mes la
promocin 2 x 1 que puede usarse entre dos amigos en la misma fecha o puede ser usado
por la misma persona dos fechas consecutivas. Se muestra un cuadro con el nmero de
ventas realizada en 10 semanas. El registro se realiz Sin Promocin (1) y Con
Promocin (2).
Semana
1
2
3
4
5
6
7
8
9
10
Estadstica Aplicada

Pgina 212

(1) Sin promocin

30

28

30

22

24

26

28

30

30

28

(2) Con promocin

40

36

32

28

33

30

30

32

28

34

El rea comercial afirma que el plan Aerbicos Domingueros incrementa las ventas
promedio en ms de 6 clientes. Asuma normalidad, use Alfa=0,01. Tienen razn en su
afirmacin?
81. Con fines de recaudacin la Sunat ha estado aplicando dos mtodos para registrar las
declaraciones juradas de sus contribuyentes. El primero exige al contribuyente
presentarse personalmente ante un encargado de la Sunat; el segundo le permite enviar
por correo su declaracin jurada. Los directivos de la recaudacin de impuestos piensan
que el primer mtodo ocasiona menos errores que el segundo. Por ello, autoriza un
examen aleatorio de 50 listados de la presentacin personal ante el encargado y 75
listados del registro por correo. Un 10 % de las presentaciones personales contienen
errores y 13,3% de los formularios enviados por correo tambin los contienen. A un nivel
de significacin del 5%, se puede afirmar que los directivos de la Sunat tienen razn?
82. En una encuesta se pregunt a 1035 adultos sobre su percepcin respecto a la
participacin de las compaas estadounidenses en la economa global. 704 de los
encuestados respondieron bien o excelente. En una encuesta similar, realizada cuatro aos
despus, 582 de 1 004 adultos encuestados respondieron a la misma pregunta como bien
o excelente. Con los resultados muestrales, se puede concluir que la proporcin de
adultos que respondieron bien o excelente se increment en los ltimos cuatro aos? Use
un nivel de significacin del 10%.
83. Se desea comparar la proporcin de morosos del sector salud y del sector educacin de la
empresa financiera. Para lo cual se seleccion dos muestras aleatorias y los resultados se
muestran en la tabla:

Al da

Salud

Educacin

30

40

Morosos
25
50
A un nivel de significancia del 3%, se puede afirmar que la proporcin de clientes
morosos del sector salud es menor en 0,15 a la proporcin de clientes morosos del sector
educacin?
84. Una Universidad cuenta con un total de 5 000 estudiantes, de los cuales 2 400 proceden
de la regin donde se ubica la universidad y el resto procede de otras regiones. Una
muestra aleatoria de 250 estudiantes de la regin, indica que el 48% prefiri acampar en
la playa el pasado fin de semana largo. As mismo de 250 estudiantes procedentes de
otras regiones, el 40% tambin prefiri acampar en una playa. A un nivel de significancia
del 5% pruebe si se puede considerar que existe diferencia en la proporcin de
estudiantes que prefirieron acampar en la playa.

Estadstica Aplicada

Pgina 213

85. Se desea saber si hay diferencia significativa entre el rendimiento en las ventas del
personal que recibe un curso de entrenamiento y aquellos a los que no se les imparte. Se
tom una muestra aleatoria de 60 vendedores adiestrados obtenindose un ndice de
rendimiento promedio de 7,35 y una desviacin estndar de 1,2. Por otra parte, se
seleccionaron 80 vendedores no capacitados resultando un ndice de rendimiento
promedio de 6,85 y una desviacin estndar de 1,5. Realice la prueba correspondiente y
concluya en trminos del problema. Asumiendo distribucin normal y para un = 0.10.
86. El gerente de operaciones de UNIBANK, est interesado en saber si existe diferencia
significativa entre los tiempos de atencin al cliente de los empleados que trabajan en los
dos turnos: maana y tarde. Al respecto, ayer personalmente registr los tiempos que
utilizaron los empleados para atender a los clientes en ambos turnos y en forma aleatoria.
Los tiempos en minutos que registr fueron los siguientes:
Maana
2.10
4.10
4.70
3.70
6.00
3.90
Tarde
4.00
4.50
3.70
4.00
4.10
3.45
Usando un nivel de significacin de 5%, a qu conclusin llegar el gerente de
operaciones?
87. En un estudio de mercado, se desea evaluar la oferta promocional de un producto. Con
este fin, se seleccionan al azar 12 tiendas y se registra la venta mensual del producto antes
y despus de la oferta promocional. Con un nivel de significacin de 5%, se puede
afirmar que la oferta promocional increment las ventas del producto. Los datos se
presentan en el siguiente cuadro.
Tienda

9 10 11 12

Antes

42 57 38 49 63 36 48 58 47 51 83 27

Despus

40 60 38 47 65 39 49 50 47 52 72 33

88. La gerencia de una compaa de seguros desea evaluar la nueva escala de pagos en sus
dos clases de seguros (A y B). De una muestra aleatoria de 1050 asegurados del plan A,
780 estn de acuerdo con la nueva escala. Mientras que en una muestra de 950 de los
asegurados del plan B, 660 estn de acuerdo. Probar la hiptesis de que la proporcin de
los asegurados que estn de acuerdo con la nueva escala de pagos del Plan A es similar a
los asegurados del Plan B. Usar un =0.05.
89. Una operacin de ensamblaje en una planta manufacturera requiere de un perodo de
entrenamiento de aproximadamente un mes para que un nuevo operario alcance la
mxima eficiencia. Se sugiri un nuevo mtodo de entrenamiento y se realiz una prueba
para comparar el nuevo mtodo con el procedimiento estndar. Se entren a dos grupos,
de diez y nueve obreros nuevos cada uno, durante tres semanas; un grupo utiliz el nuevo
mtodo y el otro el procedimiento de entrenamiento estndar. Se registr el tiempo, en
minutos, que tard cada trabajador en montar el dispositivo al final del perodo de tres
semanas. Estas mediciones aparecen en la siguiente tabla:
Procedimiento estndar 32 37 35 28 41 44 35 31 34 42
Procedimiento nuevo

35

31

29

25

34

40

27

32

31

Si se supone que los tiempos de ensamble se distribuyen normalmente.


Estadstica Aplicada

Pgina 214

a. Se puede afirmar con un nivel de significacin del 5%, que la variabilidad de los
tiempos de ensamble de cada procedimiento son iguales?
b. A un nivel de significacin del 5%, dira usted que el procedimiento nuevo ofrece un
tiempo medio de ensamble menor que el procedimiento estndar?
90. Una agencia de seguros local desea comparar los gastos medios ocasionados por daos en
accidentes similares en dos modelos de automviles. Nueve ejemplares del primer
modelo y siete del segundo modelo son sometidos a una colisin controlada obteniendo
los siguientes gastos, en dlares, por daos sufridos:
Modelo 1
345 310 305 345 355 375 320 310 305
Modelo 2
340 325 345 310 315 280 290
Si se supone que los gastos por daos en ambos modelos de automviles siguen una
distribucin normal, a un nivel de significacin del 5%:
a. Se puede afirmar que la variabilidad de los gastos por daos para cada modelo de
auto son iguales?
b. Parece haber alguna diferencia en el gasto medio ocasionado por las colisiones de
cada modelo de auto?
91. Para una futura campaa de captacin de clientes, uno de los factores que debe tomarse
en cuenta es la edad de los clientes. Por datos histricos se sabe que la edad de los
clientes del Fondo A es mayor que los del Fondo C y de acuerdo a los especialistas, slo
tiene sentido diferenciar una campaa entre estos grupos si es que en promedio la
diferencia de edades de los clientes es ms de 5 aos. Se seleccion una muestra de 25
clientes del Fondo A y 35 del Fondo C y se us el SPSS para analizar la informacin. A
continuacin se muestra parte de los reportes que nos brinda este software.

Prueba de muestras independientes

Prueba de Levene para


la igualdad de varianzas

Prueba T para la igualdad de medias


95%

F
Edad

Se han asumido

42,794

Sig.
,000

gl

Sig. (bilateral)

Diferencia de

Error tp. de la

medias

diferencia

58

7,869

,769

29,136

7,869

,873

varianzas iguales
No se han asumido
varianzas iguales

A un nivel de significacin del 2% indique si se deber diferenciar las campaas de


atraccin de clientes para los fondos A y C.
92. Una compaa supone que una llamada telefnica permite el cobro de cuentas morosas
ms rpido que una carta. Dos grupos de clientes morosos fueron contactados, unos por
telfono y otros por carta. Posteriormente se registr el tiempo en das que transcurrieron
entre el envo de la carta o la llamada telefnica y la recepcin del pago.
Estadstica Aplicada

Pgina 215

Mtodo Aplicado
Carta
Llamada telefnica

10
7

9
3

Tiempo transcurrido para efectuar el pago


9
11
11
12
10
5
3
8
4
9
9

Se sabe que el tiempo para la recepcin el pago, luego de haber sido contactado el cliente
moroso, sigue una distribucin normal. A un nivel de significacin del 10%:
a. Existe evidencia significativa para afirmar que la variabilidad en el tiempo para la
recepcin del pago es similar tanto para clientes contactados por carta como por
telfono?
b.

Puede la compaa afirmar que los clientes morosos contactados por telfono
responden ms rpidamente que los contactados por cartas?

30. Una entidad financiera, est evaluando los montos correspondientes a prstamos
financieros otorgados por dos entidades bancarias En ti confo y Presto al toque,
durante el primer trimestre del presente ao. Se sabe ambas entidades bancarias realizaron
durante este perodo de estudio un total de 130 prstamos financieros. Posteriormente, se
seleccion una muestra aleatoria de cada entidad bancaria encontrndose los siguientes
montos en miles de dlares otorgados en calidad de prstamo:
En ti confi

75

88

65

100

100

95

82

57

42

100

Presto al toque

95

80

72

63

100

45

81

92

50

72

72

49

100

85

90

Si se sabe que los montos correspondientes a prstamos financieros siguen una


distribucin normal,
a. Se puede afirmar que las entidades bancarias presentan diferentes variabilidades en
los montos correspondientes a sus prstamos financieros, con un nivel de
significacin del 2%?
b.

Es correcto afirmar que la entidad bancaria En ti confo otorga en promedio los


mayores montos correspondientes a prstamos financieros con un nivel de
significacin del 2%?

93. Una muestra de las calificaciones en un examen presentado en un curso de Estadstica es:
GRUPO 1
GRUPO 2

72

69

98

66

85

76

79

81

67

90

78

81

80

76

80

77

Al nivel de significacin del 5%


a) Se puede decir que ambos grupos tienen la misma variabilidad en sus calificaciones?
b) La calificacin media del grupo 02 es superior a la del grupo 1?
94. Una compaa de seguros afirma que, en comparacin con su mayor competidor, entre
sus empleados hay un mayor nmero de trabajadores capacitados en el ltimo ao. De
una muestra aleatoria de 420 empleados suyos, 155 han recibido algn curso de
capacitacin en el ltimo ao. En cambio, de 336 empleados seleccionados al azar de su
mayor competidor, 144 han recibido algn curso en el ltimo ao.
a. A un nivel de significacin del 5%, se puede decir que la afirmacin de la compaa
de seguros es correcta.

Estadstica Aplicada

Pgina 216

b.

A un nivel de significacin pruebe si existe diferencia entre las proporciones de


empleados capacitados en ambas compaas en el ltimo ao.

95. Una empresa de investigacin de mercados obtuvo una muestra de personas para evaluar
el potencial de compras de cierto producto, antes y despus que esas personas vieran un
nuevo comercial en televisin sobre el producto. Las calificaciones de potencial de
compra se basaron en una escala de 0 a 10, donde los valores mayores indicaban un
mayor potencial de compra. Los datos se presentan en la siguiente tabla, al nivel de
significacin del 5%, se podra decir que el comercial ha tenido efecto en las compras?

Calificacin de la compra
Antes
Despus
5
6
4
6
7
7
3
4
5
3
8
9
5
7
6
6

Individuo
1
2
3
4
5
6
7
8

96. El administrador de GYM PLUS afirma que la proporcin de mujeres que pagan el
gimnasio en efectivo es mayor que proporcin de hombres que pagan el gimnasio en
efectivo. Se tom una muestra de 150 pagos realizados por mujeres de un total 1800 y se
encontr 50 pagos en efectivo. Se tom otra muestra de 300 hombres y se encontr 40
pagos en efectivo.
Tienen razn el administrador al afirmar que la proporcin de mujeres que pagan en
efectivo es mayor en ms del 10% que la proporcin de hombres que pagan en efectivo?
Use Alfa=0,025
97. Debido a los acontecimientos en la economa mundial de los ltimos aos, los clientes del
banco en general consideran que las tasas de variacin de los fondos del 2010 respecto al
2009 han disminuido en promedio si se comparan con las tasas de variacin del 2009
respecto al 2008. Para corroborar si la percepcin de los clientes se ajusta a la realidad, se
toma una muestra de nueve clientes y se registran las tasas de variacin de sus fondos en
ambos perodos (2010/2009 y 2009/2008), tal como se muestra en la siguiente tabla:
Cliente
Tasa de variacin
2010/2009 (%)
Tasa de variacin
2009/2008 (%)

porcentual
porcentual

3,3

1,8

1,2

0,05

3,4

2,7

4,1

2,3

4,9

4,8

0,9

1,5

0,07

4,8

3,1

6,4

4,8

Con un nivel de significancia del 4%, indique si la percepcin de los clientes concuerda
con la realidad.
98. Una de las principales preocupaciones del banco BSP es la atencin personalizada a sus
clientes, en particular, a los clientes de fondos de inversin. Dados los acontecimientos
Estadstica Aplicada

Pgina 217

de la economa mundial, un punto muy sensible en la percepcin de la calidad del


servicio es que los clientes estn oportunamente informados sobre el estado de sus
inversiones. Se envi una encuesta va internet y
a continuacin se presentan los
resultados de una de las preguntas:
Clientes satisfechos por la informacin oportuna
sobre el estado de sus inversiones

Clientes satisfechos

37.5%

34.0%

32.8%
35%
30%
25%
20%
15%
10%
5%
0%

Fondo A

Fondo B

Fondo C

Tipo de fondo de inversin

Fuente: Departamento de Atencin Personalizada BSP


Ficha tcnica: Se envi va internet la encuesta a la totalidad de clientes: 12 754 del fondo A, 3254 del
fondo B y 1775 del fondo C. Fueron respondidas por 250 clientes del fondo A, 300 del fondo B y 120
del fondo C.

A un nivel de significacin del 5%, se puede considerar que no hay diferencia entre la
proporcin de clientes del fondo A y C satisfechos por la informacin oportuna?
99. Publicidad Pacifico, investiga la relacin entre el tipo favorito de mensaje comercial y el
nivel de ingresos para una muestra de consumidores. Los datos son:
Comercial favorito
Ingreso

Bajo

25

40

70

Medio

30

30

30

Alto

45

20

10

Pruebe, a un nivel de significacin del 5%, si el nivel de ingreso se relaciona con la


preferencia de comerciales.
100.Se realiz una encuesta entre amas de casa de los sectores socioeconmicos A, B y C
para determinar su preferencia por uno de dos detergentes ms utilizados en el mercado.
Los resultados de la investigacin se muestran en la siguiente tabla. Sobre la base de los
datos mostrados y usando un nivel de significacin de 0,05 verifique si la preferencia por
un detergente depende del nivel socioeconmico.

Nivel A
Nivel B
Nivel C
Estadstica Aplicada

Nmero que favorece el


detergente Alfa
197
260
232

Nmero que favorece el


detergente Beta
203
240
168
Pgina 218

101.Se est considerando cuatro marcas de lmparas elctricas para su uso en una gran planta
manufacturera. El director de compras pidi muestras de 100 a cada fabricante. Las
cantidades de productos aceptables e inaceptables de cada uno se indican a continuacin.
Al nivel de significacin del 5%, existe alguna diferencia en la calidad de las bombillas?
Fabricante

Producto

Aceptable

12

11

Inaceptable

88

92

95

89

102.Se clasific una muestra de agencias inmobiliarias segn el tamao (medido como el
nmero de empleados) y segn si tena o no un plan de marketing. Con los datos que se
presentan en la siguiente tabla, contrastar con un nivel de significacin del 1% la
hiptesis de no asociacin entre el tamao de las agencias inmobiliarias y el tener o no un
plan de marketing.
Plan de marketing
N de empleado
Si
No
Menos de 100
13
10
Entre 100 y 500
18
12
Ms de 500
32
40
103.El jefe de una planta industrial desea determinar si existe relacin entre el rendimiento en
el trabajo y turno laboral del empleado. Se tom una muestra aleatoria de 400 empleados
y se obtuvo las frecuencias observadas que se presentan en la siguiente tabla de
contingencia:
Turno Laboral
Rendimiento en el trabajo
Maana

Tarde

Noche

Total

Deficiente

23

60

29

112

Promedio

28

79

60

167

Muy bueno

49

63

121

Total

60

188

152

400

Con el nivel de significacin del 1%, la calificacin del rendimiento del trabajador est
asociada con el turno en el que labora el empleado?
104.El Gerente de una empresa publicitaria desea evaluar la publicidad por televisin de un
nuevo producto. Los anuncios se exhibieron por separado a grupos de consumidores en
un auditorio; donde cada consumidor slo mira uno de los tres anuncios y despus emite
una opinin acerca del producto que vara desde 1 (muy favorable) hasta 5 (muy
desfavorable). Los resultados se muestran en la siguiente tabla.
Anuncio
1
A
Estadstica Aplicada

32

2
87

Opinin
3
4
91
46

5
44
Pgina 219

53
41

B
C

141
93

76
67

20
36

10
63

Hay evidencias estadsticas para afirmar que la opinin omitida por los consumidores es
igual para los distintos anuncios?. Usar un =0.05.
105.Por la temporada de verano se ha realizado un estudio respecto a la opinin que tienen los
visitantes de la playa que visita. Se seleccionaron aleatoriamente cuatro playas y los
resultados se muestran en la tabla.
Pucusana
San Bartolo
Totoritas
Puerto Azul
Favorable

39

30

35

40

Desfavorable
18
12
16
14
A un nivel de significacin del 10%, se puede afirmar que la opinin favorable se
presenta en proporcin similar en las diferentes playas?
106.El departamento de Recursos Humanos de Enigma Enterprise desea determinar si el
ausentismo de sus empleados se relaciona con la edad. Para tal fin se toma una muestra
de 200 empleados al azar y se clasifica segn la edad y la causa del ausentismo. Los
resultados son los siguientes:
Causa

Menos de 30
aos

De 30 a 50 aos

Ms de 50 aos

Enfermedad

40

28

52

Otra

20

36

24

Se encuentra la edad de los empleados relacionada con las causas del ausentismo?
Considere un nivel de significacin del 10%.
107.Un estudio de la relacin entre las condiciones de las instalaciones en gasolineras y la
agresividad en el precio de la gasolina, reporta los siguientes datos basados en una
muestra de 441 gasolineras. Al nivel de significacin del 1%, sugiere la informacin que
las condiciones de las instalaciones y la poltica de precios son independientes entre s?
Poltica de precios
Condicin de la instalacin
Agresiva
Neutral
No agresiva
Anticuada

24

15

17

Condicin estndar

52

73

80

Moderna

58

86

36

108.Una sociloga desea saber si existe alguna relacin entre el nivel de instruccin y las
actividades sociales de una persona. Decidi manejar tres niveles de instruccin: Asisti
o termin la instruccin universitaria, asisti o termin la preparatoria y asisti o termin
la primaria. Cada persona llev un registro de sus actividades sociales, practicar deporte
en grupo, asistir a bailes o ceremonias. La sociloga los dividi en frecuencia superior al

Estadstica Aplicada

Pgina 220

promedio, frecuencia promedio y frecuencia inferior al promedio. A un nivel de


significacin del 5%, cul debe ser la conclusin de la sociloga?
Actividad social
Instruccin
Superior al
Inferior al
Promedio
promedio
promedio
Universitaria

18

12

10

Preparatoria

17

15

13

Primaria

22

109.Doscientos hombres de varios niveles gerenciales seleccionados al azar fueron


entrevistados respecto a su inters o preocupacin por los temas ambientales. La
respuesta de cada persona se registr en cada una de tres categoras: sin inters, algo de
inters y gran inters. Los resultados fueron:
Nivel directivo
Sin inters
Algo de inters Gran preocupacin
15
13
12
Gerencia superior
27
26
27
|Gerencia media
28
21
31
Supervisor
Utilizando un nivel de significacin del 1%, determine si hay alguna relacin entre el
nivel directivo y su inters por los temas ambientales.
110.En una fbrica se cuenta con tres mquinas que producen el mismo producto. El jefe de
produccin desea determinar si las mquinas estn produciendo en diferentes
proporciones. Para despejar sus dudas selecciona al azar 135 artculos de la ltima
semana de produccin y los clasifica segn la mquina que lo ha producido. A
continuacin se presenta la tabla de frecuencia de las cantidades producidas por cada
mquina:
Mquina A
Mquina B
Mquina C
43

53

39

Use nivel de significacin 5% para probar si la cantidad producida no es la misma en las


3 mquinas.
111.Una entidad financiera trata de seguir una poltica de extender un 60% de sus crditos a
empresas comerciales, un 10% a personas naturales y un 30% a prestatarios extranjeros.
Para determinar si la poltica se estaba siguiendo, el analista de marketing selecciona una
muestra aleatoria de 85 crditos de aprobacin reciente. Encuentra que 62 de tales
crditos se otorga a empresas comerciales, 10 a personas naturales y 13 a prestatarios
extranjeros. Con un nivel de significacin del 10%, se puede afirmar que la poltica de
crditos se mantiene.
112.Uno de los puntos importantes para lograr competitividad dentro de la empresa Cleaner
Up SA es medir la satisfaccin de los clientes. La empresa tiene a sus clientes en 4
zonas de Lima: A, B, C y D. Selecciona una muestra de 50 clientes de cada una de ellas y
les enva la encuesta va on line sobre el nivel de satisfaccin del servicio prestado
donde, PS= poco satisfechos, S= satisfechos y MS =muy satisfechos. Si hay pruebas de
que las cuatro zonas no son similares con respecto a los niveles de satisfaccin de los
clientes, decidir asignar un presupuesto para que se desarrolle un Plan de Capacitacin
Estadstica Aplicada

Pgina 221

y Desarrollo de los Recursos. Al nivel de significacin del 2%, cul ser la decisin
del gerente?

A
B
Zonas
C
D
Total

Tabla de contingencia Zonas * Satisfaccin


Satisfaccin
PS
S
8
12
Recuento
Frecuencia esperada
13,8
12
15
Recuento
Frecuencia esperada
10
12
Recuento
Frecuencia esperada
22
16
Recuento
Frecuencia esperada
13,8
52
55
Recuento
Frecuencia esperada
52,0
55,0

MS
30

Total
50

23,3
23

50,0
50
50,0
50
50,0
50
50,0
200
200,0

28
12
23,3
93
93,0

113.El gerente del BSP observa que los menos satisfechos de su informacin oportuna son los
clientes del fondo A, que es el grupo ms grande de sus clientes, y tiene la sospecha que
guarda relacin con el nivel de inversin, por lo tanto busca en su base de datos el nivel
de inversin de los clientes que respondieron a las encuesta y obtiene la siguiente tabla.
Satisfaccin
Nivel de inversin

Total

Satisfechos

No satisfechos

Menor de 10000

10

80

90

Entre 10000 y 20000

30

60

90

Mayor de 20000

42

28

70

Total

82

168

250

Con esta informacin se confirma la sospecha del gerente? Use un =0,01.


114.Conteste las preguntas siguientes, justificando adecuadamente su respuesta.
a) Bajo qu condiciones se puede efectuar un Anlisis de Varianza?
b) En un anlisis de varianza de dos factores cuntas variables se analizan y en qu
escala de medicin debe estar cada una de ellas?
c) Cules son los supuestos del anlisis de varianza?
115.Se desea analizar el tiempo, en minutos, de espera para ser atendido en el servicio de
fotocopias de la universidad, para ello se realizaron observaciones en los diferentes
puntos donde se brinda este servicio: Centro de Informacin, Losa deportiva y Cafetn.
Los datos se muestran en la siguiente tabla:
N
Centro de informacin
Losa deportiva Cafetn
1
1,0
2,2
2,7
2
2,2
4,4
4,9
3
2,4
4,6
5,1
4
2,4
4,6
5,1
5
2,2
4,4
4,9
6
3,6
5,8
6,3
7
3,1
5,3
5,8

Estadstica Aplicada

Pgina 222

Si usted y su equipo de trabajo necesitan urgentemente sacar copias de su trabajo de


aplicacin, con un nivel de significacin del 5%, a cul de los servicios de fotocopias
recurrira.
116.Se pide a cuatro personas que beban una marca determinada de caf y registren el nmero
de tazas que consumen durante el da. Se hace lo mismo con bebedores de otras tres
marcas. Los resultados se muestran en la siguiente tabla. Con un nivel de significacin de
0,05 pruebe si existe alguna diferencia en el nmero promedio de tazas promedio
consumidas, para cada marca.
Marca A
Marca B
Marca C
Marca D
3
5
2
3
2
1
10
6
5
4
5
4
6
6
7
5

117.Se obtienen muestras de pesos de llenado de cuatro paquetes de espinacas refrigeradas, a


partir de 3 contenedores, con el propsito de determinar si los pesos promedio de los
paquetes son iguales o diferentes entre los tres contenedores. A continuacin se presentan
los pesos (kilogramos) registrados.
Contenedor 1
Estadstica Aplicada

Contenedor 2

Contenedor 3
Pgina 223

12,4
13,7
11,5
10,3

11,9
9,3
12,1
10,6

15,3
12,4
13,9
14,2

Basado en los datos presentados, los resultados obtenidos en SPSS son los siguientes:

a. Verifique si se cumplen los supuestos necesarios para validar los resultados.


b. Plantee la hiptesis y pruebe, a un nivel de significacin de 0,05 si el peso promedio
de los paquetes de espinaca es diferente en al menos uno de los contenedores.

Origen

Suma de
cuadrados

Contenedor

18.335

gl

F critico
Media
cuadrtica Fcalculado ( = 5%)

Error
Total

33.8799

c. Realice la prueba de comparacin de Duncan. D sus conclusiones a un nivel de


significacin del 5%.
118.Se sea llevar a cabo un seminario de administracin gerencial para ejecutivos de
manufactura, finanzas y comercio. Antes de empezar el seminario el Coordinador del
seminario est interesado en saber si los tres grupos de participantes tienen conocimientos
Estadstica Aplicada

Pgina 224

semejantes sobre principios de administracin; con esta finalidad toma muestras de cada
grupo y les aplica una prueba. Los resultados fueron:
Manufactura
56
39
48
38
73
50
62
Finanzas

103

87

51

95

68

42

Comercio

42

38

89

75

35

61

107

89

Con un nivel de significacin de 5%, de sus conclusiones para apoyar al coordinador del
seminario.
119.El gerente de personal de una compaa que fabrica computadoras quiere capacitar a los
empleados que trabajan en operaciones de ensamblado mediante uno de los 4 diferentes
programas de motivacin (Alfa, Beta, Gamma y Sigma) que se ofrecen en el mercado.
Como no se decide por uno de ellos, realiza un experimento que consiste en distribuir
aleatoriamente a 20 empleados en los 4 programas de motivacin para posteriormente
evaluar su tiempo de ensamblado (en minutos). Los resultados luego de la capacitacin
fueron los siguientes:
Repeticin

Programa
Alfa

Beta

Gamma

Sigma

64

59

65

58

67

58

68

60

62

61

63

59

64

59

64

62

66

58

65

60

Total

323

295

325

299

Promedio

64.6

59.0

65.0

59.8

Si Ud. fuera el gerente que programa escogera? De sus conclusiones a = 5%.


120.Un grupo de amigos desea analizar el gasto, en soles, que realizan las personas que
visitan algn balneario. Seleccionaron aleatoriamente las playas que se muestran en la
tabla y se registraron el gasto total que realizaron. Si un grupo de jvenes le consulta a
qu balneario deben dirigirse sabiendo que no cuentan con mucho dinero, cul sera su
consejo? Use un nivel de significacin del 5%.
San
Puerto
N Pucusana
Totoritas
Bartolo
Azul
42
48
35
31
1
43
40
26
49
2
50
39
31
47
3
43
45
30
54
4
38
35
27
52
5
121.Respecto a la pregunta anterior, uno de los amigos del equipo de investigacin considera
que el da, durante la semana, en que se visita el balneario tambin puede influenciar al
gasto de los visitantes. Por ello propuso analizar los datos de la tabla, con un nivel de
significacin del 5%, con la intencin de determinar si algn balneario o algn da de la
semana o una combinacin de ambos, permitira un menor gasto.
Estadstica Aplicada

Pgina 225

Pucusana

San Bartolo

Totoritas

Puerto Azul

Lun Mie

48
46

49
51

40
38

45
48

Jue Vie

46
48

51
50

38
35

44
46

Sb - Dom

48
48
37
48
51
53
35
48
122.Suponga que usted y su equipo de investigacin, con respecto al caso de la pregunta
anterior, tienen la sospecha que el tiempo de espera para ser atendido en los servicios de
fotocopias estara afectado adems por el turno en el que nos presentamos al servicio.
Para realizar este anlisis se obtuvo la informacin que se muestra en la tabla. Con un
nivel de significacin del 2% se puede afirmar que algn lugar de atencin o algn turno
de atencin o una combinacin de ambos determina un tiempo de espera conveniente
para el alumno?
Centro de
Losa
Cafetn
Informacin
deportiva
Maana

Tarde

Noche

1,5

4,2

3,8

4,7

7,3

6,8

4,1

6,6

7,2

3,6

5,9

6,5

4,8

7,3

7,2

3,8

6,1

6,7

3,4

5,6

6,2

4,4

6,8

7,4

3,1

5,3

6,2

123.Con el propsito de mejorar el desempeo alumnos al presentarse en el examen GMAT


que se califica desde 200 hasta 800; las ms altas indican mayor aptitud. Una prestigiosa
universidad planea ofrecer los siguientes tres programas de preparacin: Una sesin de
repaso de tres horas, un programa de un da y un curso intensivo de 10 semanas. Al
examen se presentan generalmente alumnos de tres carreras: Administracin, Ingeniera y
alumnos de Ciencias. Adems se cuenta con la siguiente informacin:

Programa

Administracin Ingeniera

Ciencias

Repaso de 3
horas

500

540

480

580

460

400

Programa de
un da

460

560

420

540

620

480

Curso de 10

560

600

480

Estadstica Aplicada

Pgina 226

600

semanas

580

410

Elabore un informe completo y detallado de la informacin que se le presenta. Utilice


un nivel de significacin del 5%
124.Los siguientes datos corresponden al nmero de hornos de microondas que se vende en
cada una de las tres sucursales de una compaa distribuidora de artculos domsticos.
Las tablas de salidas de resultados que brinda el software SPSS al introducir los datos
anteriores en la opcin de comparacin de medias para anlisis de varianza de un factor
se muestran a continuacin.

Sucursales
Alfa

Beta

Gamma

21

32

24

15

20

17

17

30

20

22

26

12

24

15

21

TABLA ANOVA
VENTA

Entre
tratamientos
Dentro de
tratamientos
Total

Suma de
cuadrado
s

Cuadrado
medio

gl

214.150

107.075

218.783

12

18.232

432.933

14

Sig.

5.873

.017

Procedimiento de comparacin mltiple


Dependent Variable: VENTA
LSD

(I) SUCURSAL
Alpha

(J) SUCURSAL
Betha
Gamma

Betha
Gamma

Dif erencia de
medias (I-J)
-7.6500*

Intervalo de conf ianza del 95%


Error tpico
2.8643

Sig.
.020

Lmite inf erior


-13.8908

Lmite superior
-1.4092

.5833

2.7562

.836

-5.4219

6.5886

Alpha

7.6500*

2.8643

.020

1.4092

13.8908

Gamma

8.2333*

2.5855

.008

2.5999

13.8668

Alpha

-.5833

2.7562

.836

-6.5886

5.4219

Betha

-8.2333*

2.5855

.008

-13.8668

-2.5999

*. La dif erencia de medias es signif icativa al nivel de 0.05.

Estadstica Aplicada

Pgina 227

a. Al nivel de significacin del 5%, se puede concluir que existe una diferencia en el
nmero promedio de hornos de microondas que se venden en cada sucursal?
b.

Determine la o las sucursales que logran mayores niveles de ventas de este tipo de
artculo domstico. Argumente.

125.Un parque de diversiones ha estudiado mtodos para disminuir el tiempo de espera (en
minutos) para los juegos, haciendo que las personas entren a ellos y salgan en una forma
ms eficiente. Se han propuesto tres mtodos alternos de entrada y salida a los juegos.
Para tener en cuenta diferencias potenciales debidas al tipo de juego y a la interaccin
posible entre el mtodo de entrada y salida y el tipo de juego, se dise un experimento
factorial. Con los siguientes datos, pruebe si hay algn efecto importante debido al
mtodo de entrar y salir, al tipo de juego y a la interaccin. La salida del anlisis factorial
utilizando el paquete SPSS en su opcin Modelo lineal general se muestran a
continuacin.
Juego
Rueda de la

Casa del

Canal de

fortuna

terror

lanchas

41

52

50

40

50

50

43

44

46

49

50

48

48

45

46

51

46

44

47

43

51

48

42

50

50

46

49

Mtodo 1

Mtodo 2

Mtodo 3

126.Un investigador de mercados de una cadena de supermercados est interesado en el


estudio del efecto de la colocacin de estantes sobre la venta de un producto. Se
estudiaron cuatro lugares distintos donde colocar los estantes: normal (A), colocacin
adicional en la tienda (B), nueva colocacin y un anunciador del producto (C) y
colocacin normal con listones de propaganda (D). Se tomaron tres tamaos de tiendas
diferentes: pequea, mediana y grande. Para cada colocacin de estantes se seleccion
una muestra aleatoria de dos tiendas de cada tamao. Los resultados de las ventas
semanales (en cientos de dlares) se muestran en el siguiente cuadro:
Ubicacin del estante
Tamao
de tienda
Pequea
Mediana
Estadstica Aplicada

45
48
50
57
55

56
60
63
69
80

65
70
71
73
82

48
50
53
60
60
Pgina 228

a.

78
80
57
65
70
75
82
71
72
80
80
73
Grande
78
82
89
75
Pruebe todas las hiptesis relevantes a un nivel de significacin del 5%.

b.

Resuma sus conclusiones.


Prueba de Kolmogorov-Smirnov para una muestra

N
Parmetros normales

a,b

Diferencias ms
extremas

Residuo
para Ventas
36
.0000

Media
Desviacin tpica

3.20416

Absoluta
Positiva
Negativa

.095
.095
-.095
.569
.902

Z de Kolmogorov-Smirnov
Sig. asintt. (bilateral)
a. La distribucin de contraste es la Normal.
b. Se han calculado a partir de los datos.

ontraste de Levene sobre la igualdad de las varianzas erraor


Variable dependiente: Ventas semanales, en
cientos de dlares
F
1.294

gl1

gl2
11

Significacin
.286

24

Contrasta la hiptesis nula de que la varianza error de la


variable dependiente es igual a lo largo de todos los grupos.
a. Diseo: Interseccin+Ubicacin+Tamao+Ubicacin
* Tamao

Pruebas de los efectos inter-sujetos


Variable dependiente: Ventas semanales, en cientos de dlares

Fuente
Modelo corregido
Interseccin
Ubicacin
Tamao
Ubicacin * Tamao
Error
Total
Total corregida

Suma de
cuadrados
tipo III
4609.889a
162946.778
1844.556
2572.056
193.278
359.333
167916.000
4969.222

gl
11
1
3
2
6
24
36
35

Media
cuadrtica
419.081
162946.778
614.852
1286.028
32.213
14.972

F
27.991
10883.273
41.066
85.894
2.152

Significacin
.000
.000
.000
.000
.084

a. R cuadrado = .928 (R cuadrado corregida = .895)

Ubicacin del estante

Estadstica Aplicada

Pgina 229

Ubicacin del estante * Tamao de tienda


Variable dependiente: Ventas semanales, en cientos de dlares
Intervalo de confianza al
95%.
Ubicacin del estante
A

Tamao de tienda
Pequea
Mediana
Grande
Pequea

Mediana
Grande
Pequea
Mediana

Grande
Pequea
Mediana
Grande

Media
47.667
59.000
73.333
59.667
75.667
79.000
68.667

Error tp.
2.234
2.234
2.234
2.234
2.234
2.234
2.234

Lmite inferior
43.056
54.389
68.723
55.056
71.056
74.389
64.056

Lmite
superior
52.277
63.611
77.944
64.277
80.277
83.611
73.277

78.333
83.667
50.333
59.000
73.000

2.234
2.234
2.234
2.234
2.234

73.723
79.056
45.723
54.389
68.389

82.944
88.277
54.944
63.611
77.611

Ventas semanales, en cientos de dlares


Duncan

a,b

Subconjunto
Ubicacin del estante
A

N
9

1
60.00

60.78

Significacin

71.44
76.89
.674

1.000

1.000

Se muestran las medias para los grupos en subconjuntos homogneos.


Basado en la suma de cuadrados tipo III
El trmino error es la Media cuadrtica (Error) = 14.972.
a. Usa el tamao muestral de la media armnica = 9.000
b. Alfa = .05.

Ventas semanales, en cientos de dlares


Duncan

a,b

Subconjunto
Tamao de tienda
Pequea
Mediana
Grande
Significacin

N
12
12
12

1
56.58

68.00
1.000

1.000

77.25
1.000

Se muestran las medias para los grupos en subconjuntos


homogneos.
Basado en la suma de cuadrados tipo III
El trmino error es la Media cuadrtica (Error) = 14.972.
a. Usa el tamao muestral de la media armnica = 12.000
b. Alfa = .05.

127.El Gerente del Banco Enigma S.A quiere determinar si el monto mensual adeudado por
parte de sus clientes est influenciado por el distrito de residencia y el tipo de tarjeta de
crdito que poseen. Para ello se registraron los montos adeudados durante el mes anterior
de 36 clientes como se muestra en la siguiente tabla.
Tarjeta
Clsica

Oro

Plata

Distrito de residencia
San Borja
La Molina
930
810
950
780
900
810
890
850
860
850
880
860
800
870
780
920
920
900

Estadstica Aplicada

Miraflores
890
860
880
800
780
790
760
710
800

Ate
840
800
850
850
840
900
950
960
940
Pgina 230

a.

Conforme al contexto del enunciado, llene el cuadro siguiente:

Variable Dependiente
Unidad Experimental
Factor (es)
Tratamiento (s)

b.

Utilizando los siguientes resultados obtenidos con el SPSS, verifique si se


cumplen los supuestos necesarios para validar los resultados con un nivel de
significacin del 1%.

Contraste de Levene sobre la


igualdad de las varianzas errora
F
1,590

c.

gl1

gl2

Sig.

11

24

,165

Plantee la(s) hiptesis que sean necesarias y pruebe, a un nivel de


significacin de 0,01 si existe algn efecto del distrito de residencia y el tipo de tarjeta
de crdito (o la interaccin de ambos) en los montos adeudados de los clientes. Utilice
la tabla del anlisis de variancia obtenida con el SPSS, completando previamente los
datos en blanco.
Pruebas de los efectos inter-sujetos
Origen

Suma de cuadrados
tipo III

gl

tarjeta

1672.222

distrito

37111.111

tarjeta * distrito

95305.556

144955.556

35

Media
cuadrtica

Error
Total corregida
d.

En caso de que existan diferencias significativas en la(s) prueba(s) anterior(es)


realice las comparaciones mltiples que se requieran y de sus conclusiones. Para

Estadstica Aplicada

Pgina 231

sustentar sus resultados utilice solamente las salidas del SPSS que sean necesarias y se
muestran a continuacin.

128.Una compaa que vende regalos por correo cuenta con los siguientes datos muestrales
para las ventas, en dlares, realizadas. Clasificados por la forma como se efectu el pago
y el distrito de residencia del cliente. Pruebe a un nivel de significacin del 5%, si hay
algn efecto importante en las ventas debido al distrito de residencia del cliente, a la
forma de pago y a la interaccin.
Distrito de residencia
Forma de pago
San Isidro La Molina Miraflores
Surco

Tarjeta de crdito

Cheque

Efectivo

93

81

89

84

90

80

87

90

81

88

85

89

85

80

85

89

85

78

88

86

79

90

80

87

76

95

77

90

72

96

78

92

71

96

129.Conteste las preguntas siguientes, justificando adecuadamente su respuesta.


a. Cules son los supuestos de la regresin?
b. Qu consecuencias produce la existencia de multicolinealidad?
Estadstica Aplicada

Pgina 232

c. Por qu es importante el coeficiente de determinacin ajustado en el modelo mltiple


de regresin?
d. Cmo se detecta la multicolinealidad?
e. Cul es la interpretacin del error estndar de los coeficientes de la regresin?
f. Cmo interpreta el error estndar del coeficiente de regresin?
g. Por qu es importante el coeficiente de determinacin ajustado o corregido?
h. Cmo interpreta el error tpico del coeficiente de correlacin?
i. Cundo decimos que un modelo de regresin lineal es vlido?
j. Se desea investigar, si existe alguna relacin entre el promedio de calificaciones
obtenido por los estudiantes de universidad y sus ingresos 10 aos despus de su
graduacin. Qu herramienta estadstica permitir obtener una adecuada conclusin
del estudio?
130.El supervisor del Departamento de Trnsito de la Municipalidad de Lima debe determinar
si existe una relacin directa entre el costo anual de mantenimiento de autobuses urbanos
y los aos que llevan en operacin. Si existe relacin, el supervisor cree que puede hacer
mejores pronsticos del costo de mantenimiento. Para ello recoge los siguientes datos:
Autobs Costo de mantenimiento
Tiempo de operacin
(dlares)

(aos)

859

682

471

708

1094

11

224

320

651

1049

12

Los resultados, al procesar los datos en SPSS fueron los siguientes:

Resumen del modelo


Model
o

.938a

R cuadrado
.879

R cuadrado Error tp. de la


corregida
estimacin
.862

111.610

DurbinWatson
2.560

ANOVA

233

Modelo

Suma de
cuadrados

Regresin

634819.735

634819.735

Residual

87197.154

12456.736

722016.889

Total

Media
cuadrtica

gl

Sig.
.000a

50.962

Coeficientes
Coeficientes no
estandarizados

Modelo
Constante
Tiempo de operacin (aos)

Error tp.

208.203
70.918

75.002
9.934

Coeficientes
tipificados

Sig.

2.776
7.139

.027
.000

Beta
.938

a. Para un modelo de regresin lineal simple, presente la ecuacin estimada, interprete la


pendiente y valide el modelo. Utilice un = 0,05.
b. Se puede afirmar que la correlacin entre el costo de mantenimiento y el tiempo de
operacin es mayor de 0.9? Utilice un = 0,05.
131.Un profesor de Estadstica de la UPC quiere estimar la nota final de sus actuales alumnos
del curso de Estadstica Experimental teniendo como base la nota final que obtuvieron en
el curso de Estadstica Aplicada a los Negocios. Para tal fin toma como base una muestra
al azar de 10 alumnos que llevaron los cursos en semestres anteriores (si el alumno llev
un curso ms de una vez, se toma la nota que obtuvo en la primera oportunidad). Las
notas de los alumnos seleccionados se muestran a continuacin:
Alumno

10,5

04,5

14,5 13,5 19,0 16,5 18,0 11,5 17,5 10,5

E. Experimental 13,0

05,0

13,5 16,0 17,0 15,5 16,5 12,5 18,0 13,5

E. Aplicada

10

a. Dibuje el diagrama de dispersin y describa la tendencia.


b. Encuentre e interprete la ecuacin de regresin sustentando cmo determina la
variable dependiente y la variable independiente.
c. Usando el estadstico t realice la prueba de hiptesis para el coeficiente de regresin
poblacional. Tome = 5%.
d. Estime el intervalo de confianza para el promedio de las notas finales en Estadstica
Experimental de un grupo de alumnos que obtuvieron en Estadstica Aplicada una nota
final de 13,0. Tome un nivel de confianza de 90 %. Interprete el resultado obtenido.
e. Estime el intervalo de confianza para la nota final en Estadstica Experimental de un
alumno si obtuvo en Estadstica Aplicada una nota final de 13,0. Tome como nivel de
confianza de 90 %. Interprete el resultado obtenido.
f. Si el alumno de la pregunta e) est llevando por segunda vez el curso, sera vlido en
la estimacin obtenida para su nota final de Estadstica Experimental? Sustente.
234

132.La gerencia de una empresa de servicios de iluminaciones elctricas, estudia las


relaciones entre los consumos de energa (en miles de kilowatts, Kw.) y el nmero de
habitaciones en una residencia privada unifamiliar. Una muestra aleatoria de 10
residencias proporcion los siguientes datos.
N de habitaciones
Consumo (miles de Kw.)

12 9 14 6 10 8 10 10 5

7 10 5

8 10 4

a. Determine, valide e intrprete el modelo de regresin lineal. Use un nivel de


significacin del 5%.
b. Estime con nivel de confianza del 95% el consumo de una residencia que tiene 11
habitaciones.
Model Summaryb

Model
1

R
.904a

Adjusted
R Square
.794

R Square
.817

Std. Error of
the Estimate
.91

a. Predictors: (Constant), Nmero de habitaciones


b. Dependent Variable: consumo de energa (miles de
kW h)

ANOVAb

Model
1

Sum of
Squares
29.733
6.667
36.400

Regression
Residual
Total

df
1
8
9

Mean Square
29.733
.833

F
35.680

Sig.
.000a

a. Predictors: (Constant), Nmero de habitaciones


b. Dependent Variable: consumo de energa (miles de kWh)

Coefficientsa
Standardi
zed
Coefficien
ts

Unstandardized
Coefficients
Model
1

B
1.333
.667

(Constant)
Nmero de habitaciones

Std. Error
1.056
.112

Beta
.904

t
1.263
5.973

Sig.
.242
.000

a. Dependent Variable: consumo de energa (miles de kWh)

133. La gerencia de Marketing de una empresa de aerolnea ha realizado una campaa publicitaria para
mejorar su demanda de vuelos. Con esta finalidad desea evaluar el impacto de la campaa
publicitaria, por lo cual la gerencia considera que se debe analizar la relacin del nmero de
pasajeros y los gastos en publicidad. Para este estudio se obtienen datos de 15 meses, los cuales se
muestra en el sgte. cuadro.

10 11 12 13 14 15 Total

10 12 8

17 10 15 10 14 19 10 11 13 16 10 12 187

15 17 13 23 16 21 14 20 24 17 16 18 23 15 16 268

X:

Gasto en publicidad (en miles de dlares)

Y:

Nmero de pasajeros (en miles de dlares)

a. Presente y describa el respectivo modelo de regresin lineal simple.


235

b. Hallar e interpretar los coeficientes de regresin estimados y la ecuacin de regresin


lineal simple.
c. Cunto es la variacin (aumento o disminucin) del nmero de pasajeros por cada $
1,000 que se gaste en publicidad?
d. Pruebe si existe la relacin lineal entre el nmero de pasajeros y los gastos de
publicidad para un nivel de significacin del 5%.
e. Calcular e interpretar el coeficiente de determinacin.
f. Cul es el nmero promedio de pasajeros, si se gast en publicidad $ 15,000 (mes
6)?. Halle su intervalo de confianza del 95%.
g. Cul es el nmero de pasajeros proyectado que viajarn para el mes 16, si se estima
que se gastar en ese mes $ 19,000.?. Halle su intervalo de confianza del 95%.
134.Un fabricante de equipos para ejercicios fsicos desea estudiar la relacin entre el tiempo
de posesin del equipo (en meses) y el tiempo que se utilizaron los equipos la semana
anterior (en horas). Para ello recogi la siguiente informacin:
2 12 7
4
6 10 5
9
2
8
Tiempo de posesin
12

Tiempo de uso

Resumen del modelo y estimaciones de los parmetros


Variable dependiente: Tiempo de uso (Y)
Ecuacin

Resumen del modelo


R cuadrado

gl1

Estimaciones de los parmetros


gl2

Sig.

Constante

b1

Lineal

,861

49,475

,000

11,159

-,871

Cuadrtico

,896

30,126

,000

13,094

-1,627

Potencia

,851

45,822

,000

21,189

-,873

Exponencial

,938

120,069

,000

14,519

-,173

b2

,057

Coeficientes
Coeficientes no
estandarizados
B
Tiempo de posesin(X)
(Constante)

Coeficientes
estandarizados

Error tpico

-,173

,016

14,519

1,655

Beta

t
-,968

Sig.

-10,958

,000

8,771

,000

La variable dependiente es ln(Tiempo de uso (Y)).

a)

Basado en los
datos presentados determine y valide el modelo de regresin. Justifique su respuesta.
Considere = 0,10.

b) Estime con una confianza del 90% el tiempo promedio de uso del equipo si este se tiene en
posesin desde hace tres meses.

236

135.El Sr. Standard Deviation es el responsable de la calidad de los productos elaborados por
Enigma S.A. El Sr. Deviation desea establecer la relacin que existe entre el tamao del
lote y el nmero de unidades defectuosas de tal manera que pueda seleccionar el mejor
tamao del lote. El Sr. Deviation recoge los siguientes dato sobre el tamao del lote
promedio y se le pide que analice:
Lote

Nmero de unidades
defectuosas
1
2
5
10
20
30
40

1
2
3
4
5
6
7

Tamao del lote


49
46
42
32
18
16
9

Los resultados obtenidos con SPSS son mostrados a continuacin:


Resumen del modelo y estimaciones de los parmetros
Variable dependiente: Cantidad de defectuosos
Resumen del modelo
Ecuacin

R cuadrado

Estimaciones de los parmetros

gl1

gl2

Sig.

Constante

b1

b2

Lineal

.930

66.237

.000

42.862

-.906

Cuadrtico

.976

81.790

.001

57.338

-2.221

Potencia

.847

27.781

.003

5339.117

-1.992

Exponencial

.939

76.382

.000

104.652

-.084

.022

Cuadrtico
Resumen del modelo
R

R cuadrado
.988

R cuadrado corregida
.976

Error tpico de la estimacin


.964

2.853

ANOVA
Suma de cuadrados
Regresin
Residual
Total

gl

Media cuadrtica

1331.164

665.582

32.551

8.138

1363.714

Sig.
81.790

.001

Coeficientes
Coeficientes no estandarizados
B
Tamao del lote
Tamao del lote ** 2

Coeficientes estandarizados

Error tpico

Beta

Sig.

-2.221

.477

-2.364

-4.651

.010

.022

.008

1.416

2.786

.050

237

Coeficientes
Coeficientes no estandarizados
B

Coeficientes estandarizados

Error tpico

Tamao del lote

Sig.

-2.221

.477

-2.364

-4.651

.010

.022

.008

1.416

2.786

.050

57.338

5.744

9.983

.001

Tamao del lote ** 2


(Constante)

Beta

Exponencial
Resumen del modelo
R

R cuadrado

R cuadrado corregida

.969

.939

Error tpico de la estimacin

.926

.379

ANOVA
Suma de cuadrados
Regresin
Residual
Total

Gl

Media cuadrtica

10.973

10.973

.718

.144

11.691

Sig.
76.382

.000

Coeficientes
Coeficientes no estandarizados
B
Tamao del lote
(Constante)

Coeficientes estandarizados

Error tpico

Beta

-.084

.010

104.652

34.037

-.969

Sig.
-8.740

.000

3.075

.028

c. Encuentre el mejor modelo vlido que estime el nmero de unidades defectuosas en funcin
del tamao del lote. Use un nivel de confianza del 4%. Justifique su respuesta mostrando todo
el procedimiento.

d. Con el modelo validado, calcule un intervalo de confianza del 90% para el pronstico del
nmero de unidades defectuosas promedio para los lotes con 40 unidades.

136.La empresa Sallys Software, Inc. es un proveedor de programas de computacin para


Amrica Latina. Su presencia en el mercado crece rpidamente y sus ventas en millones
de dlares para los ltimos cinco aos se indican a continuacin:
Ao
Ventas

1998 1999 2000 2001 2002


0,92

1,42

1,65

3,96

4,2

Nota: Los aos se han codificado desde: 1998 = 1 hasta 2002 = 5

a. Basado en los datos presentados determine y valide el modelo de regresin. Justifique


su respuesta. Considere = 0,05.
b. Se puede afirmar que las ventas y el tiempo que tiene la empresa en el mercado se
correlacionan en ms de 0,95. Para la prueba considere = 0,05.

238

c. Estime con una confianza del 95% las ventas promedio de la empresa para el ao
2003.
Resumen del modelo y estimaciones de los parmetros
Variable dependiente: Ventas en millones de dlares
Resumen del modelo
Ecuacin
Lineal
Cuadrtico
Potencia
Exponencial

R cuadrado
.883
.901
.876
.931

F
22.556
9.115
21.203
40.782

Estimaciones de los parmetros

gl1

gl2
3
2
3
3

Sig.
.018
.099
.019
.008

Regresin
Residual
Total

Suma de
cuadrados
8.281
1.101
9.382

1
2
1
1

Constante
-.300
.480
.800
.605

b1
.910
.241
.980
.406

b2
.111

La variable independiente esAo.

Lineal
ANOVA
Resumen del modelo

R
.939

R cuadrado
.883

R cuadrado
corregida
.843

Error tpico de
la estimacin
.606

La variable independiente esAo.

Media
cuadrtica
8.281
.367

gl
1
3
4

F
22.556

Sig.
.018

La variable independiente esAo.

Coeficientes
Coeficientes
estandarizad
os

Coeficientes no
estandarizados
Ao
(Constante)

B
.910
-.300

Error tpico
.192
.635

Beta
.939

t
4.749
-.472

Sig.
.018
.669

Cuadrtico
Resumen del modelo

R
.949

R cuadrado
.901

R cuadrado
corregida
.802

Error tpico de
la estimacin
.681

La variable independiente esAo.

ANOVA

Regresin
Residual
Total

Suma de
cuadrados
8.455
.928
9.382

gl
2
2
4

Media
cuadrtica
4.227
.464

F
9.115

Sig.
.099

La variable independiente esAo.

Coeficientes
Coeficientes no
estandarizados
Ao
Ao ** 2
(Constante)

B
.241
.111
.480

Error tpico
1.113
.182
1.461

Coeficientes
estandarizad
os
Beta
.249
.704

t
.217
.612
.329

Sig.
.848
.603
.774

Potencia

239

ANOVA
Resumen del modelo

R
.936

R cuadrado
corregida
.835

R cuadrado
.876

Regresin

Error tpico de
la estimacin
.271

Suma de
cuadrados
1.552

Media
cuadrtica
1.552

.220

.073

1.772

Residual
Total

La variable independiente esAo.

gl

F
21.203

Sig.
.019

F
40.782

Sig.
.008

La variable independiente esAo.

Coeficientes

Coeficientes no
estandarizado
s
B
Error tpico

Coeficientes
estandarizad
os
t
4.605

Sig.
.019

(Constante
.800
.190
4.219
)La variable dependiente es ln(Ventas en millones de dlares).

.024

ln(Ao)

.980

.213

Beta
.936

Exponencial
ANOVA
Resumen del modelo

R
.965

R cuadrado
.931

R cuadrado
corregida
.909

Error tpico de
la estimacin
.201

La variable independiente esAo.

Regresin

Suma de
cuadrado
s
1.650

Media
cuadrtic
a
1.650

.121

.040

1.772

Residual
Total

gl

La variable independiente esAo.

Coeficientes

Coeficientes no
estandarizados
Ao
(Constante)

B
.406
.605

Error tpico
.064
.128

Coeficientes
estandarizad
os
Beta
.965

t
6.386
4.740

Sig.
.008
.018

La variable dependiente es ln(Ventas en millones de dlares).

137.La Enigma Steel S.A. ha estado buscando los factores que influyen en la cantidad de
acero (en miles de toneladas) que es capaz de vender al ao (Y). La administracin
sospecha que los siguientes son los factores principales: la tasa anual de inflacin del pas
(X1), el precio promedio por tonelada mediante el cual el acero importado establece los
precios (en dlares) de la Allegheny (X2), y el nmero de automviles (en cientos de
miles) que los fabricantes de autos de Estados Unidos estn planeando producir en ese
ao (X3). Se ha recogido los siguientes datos correspondientes a los ltimos aos:
Ao

Y (millones de
toneladas vendidas)

X1: Tasa
de inflacin

X2: Precio promedio


de acero

X3: Nmero
de automviles

2007
2008
2009
2010

3,90
3,30
3,70
4,90

5,40
4,70
5,00
3,00

2,90
5,30
4,00
4,80

6,30
4,90
5,80
6,90
240

2011
4,00
4,30
4,20
2012
3,90
5,50
2,90
2013
3,20
7,00
2,90
Se procesaron los datos en SPSS y se obtuvo la siguiente informacin:

6,60
5,90
6,00

a. Realice el anlisis de multicolinealidad.


b. Presente y valide el mejor modelo de regresin e interprete sus coeficientes. Utilice un nivel
de significancia de 0,05.

138.El directorio de una compaa de aire acondicionado y de calefaccin est examinando


los datos correspondientes a los ingresos trimestrales (en miles de $). Los datos son los
siguientes:
Ao
Trimestre I Trimestre II Trimestre III Trimestre IV
2011

27

34

45

44

2012

33

36

46

51

2013

34

40

47

53

2014

35

42

49

55

a. Calcule los ndices estacionales de estos datos (use un promedio mvil centrado de 4
trimestres).
b. Estime el ingreso de la compaa, para el primer trimestre del ao 2015.
139.Los siguientes datos corresponden a las ventas trimestrales de Televisores LCD (en miles
de $) de la tienda X-Mart:
Ao
Trimestre Ingreso
2013

2014

2015

III

40

IV

53

34

II

47

III

42

IV

55

35

a. Calcule los ndices estacionales de estos datos, use un promedio mvil centrado de 3
trimestres.
b. Estime las ventas para el primer trimestre del ao 2015 (con estacionalidad).

241

140.Una compaa transnacional de venta de juguetes, desarroll la siguiente ecuacin de


tendencia desestacionalizada, en millones de dlares, con base en seis aos de datos

trimestrales: y 7,3841 0,1496t


La siguiente tabla muestra los ndices Mviles Ajustados correspondientes a cada
trimestre:
Trimestre
I
IMA

II

III

IV

0,76491 0,57470 1,14141 1,51898

Determine el pronstico de ventas para el sptimo ao.


141.Se cuenta con datos trimestrales sobre la venta total de cemento (miles TM)
Aos

II

III

IV

2011

1526,60

1645,38

1820,53

1810,41

2012

1585,12

1609,85

1883,20

2017,29

2013

1886,31

1937,36

2150,52

2261,44

2014

1937,03

1942,07

2171,69

2539,38

Fuente: INEI

a. Calcule los ndices estacionales usando un promedio mvil centrado de tres trimestres.
b. Estime las ventas de cemento para el ao 2015.
142.Se cuenta con datos trimestrales sobre la produccin de agua embotellada de mesa (miles
litros)
Aos
I
II
III
IV
2011

71616,44

45424,90

45378,07

64613,97

2012

80248,18

51302,09

54369,14

73153,71

2013

101889,36

63152,46

64466,90

86954,61

2014

109095,61

85450,26

90475,89

103314,44

Fuente: Ministerio de la Produccin - Viceministerio de MYPE e Industria

a. Calcule los ndices estacionales usando un promedio mvil centrado de cuatro


trimestres.
b. Estime la produccin de agua embotellada de mesa para el ao 2015.
143.Los siguientes datos corresponden a las ventas trimestrales del nuevo celular aPhone (en
miles de $) de la compaa Mapple :
Ao
Trimestre Ventas
2013

300

II

350
242

2014

III

320

IV

800

742

II

655

III

488

IV

900

a. Calcule interprete los ndices estacionales de estos datos, use un promedio mvil
centrado de 3 trimestres.
b. Sobre la base de las salidas obtenidas con el SPSS que se muestran a continuacin,
escriba la ecuacin de estimacin de la serie desestacionalizada considerando el
mejor modelo vlido de tendencia. Luego estime las ventas para el ao 2015
(considerando la estacionalidad).
Resumen del modelo y estimaciones de los parmetros
Variable dependiente:ydes
Resumen del modelo
Ecuacin

R cuadrado

gl1

Estimaciones de los parmetros

gl2

Sig.

Constante

b1

b2

Lineal

,566

7,812

,031

282,168

64,493

Cuadrtico

,625

4,175

,086

124,798

158,914

Potencia

,647 10,999

,016

290,591

,461

Exponencial

,612

,022

299,911

,129

9,478

-10,491

Potencia
Coeficientes
Coeficientes no
estandarizados
B
ln(t)
(Constante)

,461
290,591

Error tpico
,139
59,794

Coeficientes
estandarizados
t

Beta
,804

3,316
4,860

Sig.
,016
,003

144.Conservera Pez Azul est interesado en promover la venta de Salmn en conserva por
su alto valor nutritivo, motivo por el cual este producto se encuentra a la venta en el
autoservicio desde agosto del 2013. Se desea realizar la proyeccin para Abril de 2014
utilizando el mtodo de atenuacin exponencial, con una ponderacin de = 0.3, =
0.5 y = 0.8. Complete la tabla que se muestra a continuacin para cada constante de
suavizacin y realice el pronstico para Abril 2014. Debe tener en cuenta que la seal de
rastreo se encuentre dentro de los lmites indicados.
T
Mes
Venta Y est Error
1

Ag 2013

250

Set 2013

220

Oct 2013

225
243

Nov 2013

219

Dic 2013

200

En 2014

230

Feb 2014

270

Mar 2014

310
PRON
DAM

EMC

PEMA PME

145.El administrador de un restaurante desea mejorar el servicio que brinda a sus clientes y
tambin el horario de sus empleados, basndose en la afluencia diaria de clientes durante
las pasadas tres semanas y slo para los fines de semana incluyendo el viernes. El nmero
de clientes (cientos de clientes) atendidos en el restaurante en el perodo citado fue:
Clientes
Semanas Das
t
Yt
Vie

6.5

Sab

8,1

Dom

6,5

Vie

6,6

Sab

8,8

Dom

Vie

7,2

Sab

9,2

Dom

7,5

Semana 1

Semana 2

Semana 3

Se desea realizar el pronstico del nmero de clientes atendidos en el restaurante para el


viernes de la semana 4 y usando el mtodo de suavizacin exponencial, para lo cual usar
una constante de suavizacin de 0.75 y 0.9. Cul es la constante de suavizacin
exponencial que da un mejor pronstico? Debe tener en cuenta que la seal de rastreo se
encuentre dentro de los lmites indicados.
146.Los datos de la tabla que se muestran a continuacin representa el nmero de galones de
gasolina vendidos por un distribuidor de gasolina en la ciudad de Kriptonita en los 12
ltimos meses de enero a diciembre del 2013:
Mes
Venta

10

11

12

1720

2115

1980

2310

1850

1600

2120

1870

2200

2010

1550

2220

Se desea realizar el pronstico de la cantidad de galones de gasolina vendidos en el mes


de enero del 2014, para lo cual se usar el mtodo de suavizacin exponencial utilizando
las constantes de suavizacin 0.2, 0.5, 0.8 y 0.9. Cul es la constante de suavizacin que
da un mejor pronstico? Debe tener en cuenta que la seal de rastreo se encuentre dentro
de los lmites indicados.
244

S-ar putea să vă placă și