Sunteți pe pagina 1din 55

UNIF Administracin de Negocios Internacionales

Estadstica Aplicada a los Negocios

REGRESIN Y CORRELACIN LINEAL

Si se tienen n observaciones bidimensionales, cada una correspondiente a la observacin


simultnea de dos variables en cada unidad estadstica:
( X i , Yi ) : (X1 , Y1) , (X2 , Y2) , ........ , (Xn , Yn)
Cada par de datos representa un punto en el sistema cartesiano.

Este conjunto de puntos ( X i , Yi ) se


llama diagrama de esparcimiento,
diagrama de dispersin,
dispersigrama o nube de puntos.

Regresin

Es un mtodo que se emplea para encontrar una funcin que se adapte o ajuste a un
diagrama de esparcimiento con la finalidad de poder obtener una prediccin aproximada de
una de las variables a partir de la otra.

Modelos de Regresin:

Estudian la relacin cuantitativa (estocstica) entre una variable de inters Y (respuesta o


dependiente), y un conjunto de variables explicativas ( x 1 , x 2 , .... , x n ) (regresoras o
independientes)

Modelo de Regresin de Y sobre X:

Sea ( x 1 , y 1 ) , ( x 2 , y 2 ) , ..... . ( x n , y n ) observaciones de las variables X e Y para una muestra


de tamao n, donde ( y 1 , y 2 , .... , y n ) son independientes. El modelo de regresin lineal
simple est dado por:
Yi = + X i + e i
Donde y son parmetros desconocidos, ( x 1 , x 2 , .... , x n ) son valores fijos y
( e1 , e 2 , ... , e n ) son errores aleatorios.

Para estimar y se utiliza el mtodo de Mnimos cuadrados, que consiste en encontrar


aquellos valores de y que hagan mnima la suma de los cuadrados de las desviaciones
de las observaciones respecto de la recta que representa el modelo, en el sentido vertical.

La suma de las distancias elevadas al


cuadrado de cada punto hasta la lnea debe
ser tan pequea como sea posible.

Gladys Enrquez Mantilla 212


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Recta de regresin estimada: Y = a + b X

Se llama as a la recta que atraviesa el diagrama de esparcimiento y que mejor se ajusta a


l. Si llegamos a conocer la ecuacin, se podr llegar a estimar valores de Y desconocidos a
partir de valores de X conocidos.

Y = f(X) Y : Variable respuesta (dependiente o predictando)


X : Variable predictora (independiente o explicativa)

Para hallar los valores de a y b debern resolverse las dos ecuaciones siguientes, llamadas
ecuaciones Normales:
na + b X = Y
a X + b X2 = XY
Al resolver estas ecuaciones usando la regla de Cramer se obtiene:

a =
X2 Y X XY b =
n XY X Y
n X2 ( X ) n X 2 ( X )
2 2

Error o residuo: e i

Es la distancia que hay del valor observado a la


recta de regresin. Puede ser positivo o
negativo. El error de cada dato se calcula
mediante: e i = y i y i

El promedio de los errores es igual a cero, al


igual que la suma.

SUPUESTOS:

Para que sea vlido un modelo de regresin lineal, es necesario que se cumplan los
siguientes supuestos: linealidad, homogeneidad, homocedasticidad, independencia y
normalidad.
Estos supuestos son de suma importancia, pues permitirn al analista determinar de
manera tcnica, si la relacin entre las variables puede ser explicada de manera consistente,
o si existen aspectos que podran indicar que el modelo no es una buena herramienta de
prediccin, o ajuste.

Gladys Enrquez Mantilla 213


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Linealidad

Si pretendemos ajustar una lnea recta a un conjunto de datos es fundamental que stos
tengan un aspecto compatible con el de una recta. Eso significa que los datos deben ser
razonablemente rectos, es decir la recta de regresin debe representar bien la estructura de
los datos.

Datos rectos Datos no rectos

Para verificar la linealidad haremos el grfico de dispersin X-Y, es decir el diagrama de


esparcimiento asociado al conjunto de datos y comprobaremos si presentan una estructura
lineal. Esta es una comprobacin que realizamos antes de comenzar el anlisis de regresin.

Homocedasticidad

La varianza de los errores e i es constante y no depende del nivel de las variables.

Var ( e i ) = 2 , i : 1, 2 , .... , n

Esto significa que la nube de puntos de los datos tiene una anchura semejante a lo largo de
la recta de regresin. Si lo datos tienen una variabilidad constante se dice que son
Homocedsticos. Por el contrario, datos cuya variabilidad no es constante se denominan
Heterocedsticos.
Grficamente, significa que la nube de puntos de los datos tiene una anchura ms o menos
constante a lo largo de la recta de regresin.

Datos homocedsticos Datos heterocedsticos

Homogeneidad

El valor esperado o promedio de lo errores de estimacin e i es cero:

E ( e i ) = 0 , i : 1, 2 , .... , n

Esto significa que el ajuste que se va a realizar est centrado respecto de los datos, por lo
tanto cabe esperar que la recta de regresin est centrada en la nube de puntos de los
datos.

Gladys Enrquez Mantilla 214


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Independencia

Los errores o residuos e i son variables aleatorias independientes. Significa que una
observacin (un punto) no debe dar informacin sobre las dems.
El supuesto de independencia de los errores e i , se puede chequear grficamente por medio
de un diagrama de dispersin entre los residuales (eje Y) y el orden en que se tomaron las
observaciones (si se tiene, en el eje X).

Normalidad

Los errores tienen una distribucin normal: e i ~ N ( 0 , 2 ) . Lo podemos verificar mediante


un histograma o un grfico probabilstico normal de los residuos.

DIAGNOSIS DEL MODELO

Una vez ajustado el modelo es necesario comprobar que se cumplen las hiptesis que hemos
realizado. Ser necesario comprobar la linealidad de los datos, la homocedasticidad, y la
normalidad. La comprobacin de las propiedades anteriores se realiza mediante grficos.

Linealidad:

El ms importante es el grfico de residuos frente a valores ajustados o predichos, el cual


debe presentar un aspecto totalmente aleatorio sin ninguna estructura. Si tiene algn tipo
de estructura, entonces no se satisface la linealidad.

Aspecto aleatorio Aspecto no aleatorio

Gladys Enrquez Mantilla 215


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Homocedasticidad:

Al analizar los residuos, tambin hay que verificar que su varianza sea ms o menos
constante. Sern tiles los grficos de residuos frente a valores de X y de residuos frente a
valores ajustados o predichos.

Ejemplo:

Una encuesta entre vendedores de autos usados para determinar la relacin entre la
cantidad de anuncios clasificados y la venta de autos usados, dio los siguientes resultados
del nmero de avisos clasificados y el nmero de automviles usados vendidos para cada
uno de los negocios que no utilizaron ningn otro medio publicitario.
N Anuncios clasificados : 74 45 50 38 29 17
N Autos vendidos : 139 110 95 78 60 54

a) Hallar la ecuacin de regresin.

Digitar los datos en dos columnas


diferentes

Estadsticas regresin Regresin

Gladys Enrquez Mantilla 216


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Clic en Aceptar.

b) Verificar los supuestos de regresin

LINEALIDAD:

Grfica Grfica de Dispersin

Clic en Aceptar

Clic en Aceptar.

Grfica de dispersin de AutosVend vs. Anuncios


140

130

120

110
Interpretacin: En el diagrama
de esparcimiento se observa que
AutosVend

100
los datos tienen un aspecto
90
compatible con la lnea recta.
80

70

60

50
10 20 30 40 50 60 70 80
Anuncios

Gladys Enrquez Mantilla 217


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

HOMOCEDASTICIDAD

En el mismo diagrama de esparcimiento anterior se puede observar que la nube de puntos


de los datos tiene una anchura semejante a lo largo de la recta de regresin.

NORMALIDAD

Estadsticas Regresin Regresin Clic en Grficas

Clic en Aceptar y luego en Aceptar.

Grfica de probabilidad normal


(la respuesta es AutosVend)
99

95
90
Interpretacin: Se observa
80
que los puntos tienden
Porcentaje

70
60 alinearse alrededor de la
50
40 recta por lo tanto se concluye
30
que los residuos presentan
20
una distribucin normal.
10

1
-20 -10 0 10 20
Residuo

Gladys Enrquez Mantilla 218


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

c) Realizar una diagnosis del modelo.

Estadsticas Regresin Regresin Clic en Grficas

Clic en Aceptar y luego en Aceptar.

vs. ajustes
(la respuesta es AutosVend)

15

10
Residuo

-5

-10
50 60 70 80 90 100 110 120 130 140
Valor ajustado

Interpretacin: Se observa un aspecto totalmente aleatorio sin ninguna estructura, por


lo tanto se satisface la linealidad.

Correlacin

Es el mtodo empleado para determinar el grado de relacin entre las variables que se
estudian para as determinar en qu medida una relacin funcional describe o explica de
una forma adecuada la relacin entre estas variables.
La regresin por si sola no es suficiente, ya que, es verdad que busca la mejor relacin, pero
sta puede que no sea buena.

Coeficiente de correlacin lineal simple: r

Explica el grado de la bondad del ajuste del modelo de regresin. Se utiliza para saber si la
funcin lineal es representativa de la relacin entre dos variables X e Y.
1 r + 1

Gladys Enrquez Mantilla 219


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

El coeficiente de correlacin lineal se calcula mediante:

r =
XY X Y
n

X ( X ) n Y ( Y )
n 2 2 2 2

En el ejemplo:
6 25608 253 536
r = = 0.958217
( 6 12575 253 2 ) ( 6 53046 536 2 )

Como el coeficiente de correlacin pertenece a la regin de confiabilidad entonces


concluimos que con un modelo de regresin lineal podemos realizar pronsticos acertados.

Estadsticas Estadsticas Bsicas Correlacin

Al hacer clic en Aceptar.

Coeficiente de determinacin: r 2

El coeficiente de determinacin es una medida que nos informan si, en trminos globales, el
ajuste es bueno o no. Se expresa en porcentaje.
0% r 2 100%

Si r 2 tiende a 0%, la bondad del ajuste es mala puesto que la regresin tiende a explicar el
0% de las variaciones de la variable respuesta Y.

Si r 2 tiende a 100%, la bondad del ajuste es ptima, puesto que la totalidad de las
variaciones de la variable respuesta Y vienen explicadas por la regresin.

En el ejemplo:

r 2 = 0.958217 2 = 0.9182 = 91.82%

Significa que el 91.78% de las variaciones en el nmero de autos vendidos estn explicadas
por el modelo de regresin lineal.

Gladys Enrquez Mantilla 220


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Coeficiente de determinacin ajustado: R-Sq(adj)

En general el r 2 ajustado es una medida ms realista de lo que podemos esperar explicar


con el modelo. Se ajusta de acuerdo al nmero de variables independientes en el modelo.

(1 r 2 )
n 1
2
rAdj = 1
n p 1

Donde:
n : Nmero de datos.
p : Nmero de variables predictoras.

En el ejemplo:

(1 0.958217 ) = 0.8977 = 89.77%


2 6 1
rAdj = 1 2
6 1 1

Error Estndar de Estimacin (margen de error)

El error estndar de estimacin mide la variabilidad de los datos alrededor de la lnea recta
ajustada.

Si el margen de error tiende a cero, significa que cada valor de los e i tiende a tomar el valor
cero, es decir la nube de puntos est muy prxima a la recta estimada.

El error estndar de estimacin se determina mediante:

SL =
Y2 a Y b XY
n2

En el ejemplo:

53046 22.8456 536 1.5768 25608


SL = = 10.27
4

En promedio los valores reales se alejan con respecto a la recta de regresin en


aproximadamente 10 autos.

En la salida del Minitab que nos dio la ecuacin de regresin, tenemos:

Gladys Enrquez Mantilla 221


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

INFERENCIA RESPECTO A LOS PARMETROS

Despus de estimar los valores de los parmetros es conveniente analizar el grado de


precisin de la estimacin. Para ello nos valdremos de dos herramientas: intervalos de
confianza y pruebas de hiptesis.

Intervalo de confianza: IC

Un Intervalo de confianza del 95% significa que podemos estar 95% seguros de que este
intervalo incluye el valor Y (promedio de Y), para un valor determinado x 0 de la variable
predictora X.
El intervalo de confianza IC para Y es: L i Y L s y se calcula mediante:

1 n ( x 0 x )2
a + b x 0 t 0 SL +
n X2 ( X )
n 2

t 0 = t1 - /2 , n 2
En el ejemplo:

Para 55 avisos clasificados, hallar un intervalo de confianza del 95% para el nmero
promedio de autos vendidos.

Solucin:
t o = t1 - /2 , n 2 = t 0.975 , 4 = 2.776 x 0 = 55 x = 42.17

1 6 ( 55 42.17 )2
22.845555 + 1.576785 55 2.776 10.277 +
6 6 12575 253 2
95.22 Y 123.92

Con una confianza del 95%, para 55 avisos clasificados se espera que el nmero promedio
de autos vendidos sea aproximadamente como mnimo 95 y como mximo 124.

Intervalo de prediccin: PI

Un Intervalo de Prediccin del 95% significa que podemos estar 95% seguros de que este
intervalo incluye a y (valor de una nueva observacin individual), para un valor
determinado x 0 de la variable predictora X.

Este intervalo siempre es ms ancho (menor precisin) que el intervalo de confianza


correspondiente porque no buscamos predecir un valor medio sino un valor especfico; es
decir hay ms incertidumbre en la prediccin de una observacin que en la prediccin de un
valor promedio.

El intervalo de Prediccin PI para Y es: L i Y L s y se calcula mediante:

1 n ( x 0 x )2
a + b x 0 t0 SL 1 + +
n X2 ( X )
2
n

t 0 = t1 - /2 , n 2

Gladys Enrquez Mantilla 222


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

En el ejemplo:

Para 55 avisos clasificados, hallar un intervalo de pronstico del 95% para el nmero de
autos vendidos.

Solucin:
t o = t1 - /2 , n 2 = t 0.975 , 4 = 2.776 x 0 = 55 x = 42.17

1 6 ( 55 42.17 )2
22.845555 + 1.576785 55 2.776 10.277 1+ +
6 6 12575 253 2

77.63 Y 141.50

Con una confianza del 95%, para 55 avisos clasificados se espera que el nmero de autos
vendidos sea aproximadamente como mnimo 78 y como mximo 142.

Estadsticas Regresin Regresin

Clic en Opciones

Clic en Aceptar y luego en Aceptar.

Gladys Enrquez Mantilla 223


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Estadsticas Regresin Grfica de lnea ajustada

Clic en Opciones

Clic en Aceptar y luego en Aceptar.

Grfica de lnea ajustada


AutosVend = 22,85 + 1,577 Anuncios
200 Regresin
IC de 95%
PI de 95%

S 10,2770
150 R-cuad. 91,8%
R-cuad.(ajustado) 89,8%
AutosVend

100

50

0
10 20 30 40 50 60 70 80
Anuncios

Por lo tanto se concluye que es aceptable utilizar este modelo para predecir el nmero de
autos vendidos en funcin del nmero de anuncios clasificados.

Gladys Enrquez Mantilla 224


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Intervalo de confianza para

Este intervalo est centrado en la estimacin puntual del parmetro y la cantidad que se
extiende a cada lado de la estimacin depende del nivel de confianza deseado y de la
cantidad de variabilidad del estimador.
Un intervalo de confianza del ( 1 )% para la pendiente de la verdadera recta de
regresin es: L i L s

SL
b to t o = t1 - /2 , n 2
( X)
2

2
X
n

Si el intervalo es muy ancho, la precisin de la estimacin es baja. Por el contrario, un


intervalo estrecho indica que tenemos una estimacin muy precisa.
En caso de que el valor 0 est contenido podemos concluir que es posible que = 0 . En caso
de que el valor cero no est comprendido en el intervalo, concluiremos que el cero es un
valor incompatible con nuestras observaciones

En el ejemplo:

Hallar un intervalo de confianza del 95% para el coeficiente de regresin

Solucin:

to = t1 - /2 , n2 = t0.975 , 4 = 2.776

10.277
1.576785 2.776 0.92 2.23
253 2
12575
6

Con una confianza del 95% se espera que el coeficiente de regresin est variando entre
0.92 y 2.23.

ANLISIS DE VARIANZA (ANOVA) DE REGRESIN

El ANOVA trata de responder a la siguiente pregunta: es mejor usar X para predecir la


variabilidad de Y, o por el contrario se puede conseguir la misma explicacin de Y sin tener
en cuenta los valores de X, simplemente usando el valor ms representativo de Y, esto es, su
media? Si sucediera esto ltimo, la recta del modelo tendra pendiente cero, por lo que las
hiptesis a verificar son:
H0 : = 0
H1 : 0

Si se acepta H0 la variable predictora no influye y no hay relacin lineal entre ambas


variables.

Gladys Enrquez Mantilla 225


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Con frecuencia el problema de analizar la calidad de la lnea de regresin estimada se


maneja a travs de un enfoque de Anlisis de Varianza, donde la suma de cuadrados total
se particiona en dos componentes: SCT = SCR + SCE

Donde:

SCR : Refleja la cantidad de variacin de los valores de Y explicados por el modelo lineal.

SCE : Refleja la variacin alrededor de la lnea de regresin. Mide cunta variacin en Y es


dejada sin explicacin por el modelo, es decir cunto no se puede atribuir a una
relacin lineal.

Procedimiento ANOVA de regresin:

1. Hiptesis:

H0 : = 0 El modelo es Y = , es decir la variacin de Y resulta de


fluctuaciones aleatorias que son independientes de los
valores de X. No existe relacin lineal entre las variables.

H1 : 0 El modelo es Y = + X , es decir la variacin de Y se


puede atribuir a las variaciones de X. El modelo lineal es
significativo.

2. Valor Crtico: F1 , 1 , n 2

CMR
3. Estadstica de Prueba: F =
CME

Tabla de Anlisis de Varianza


Fuente de Grados de Suma de Cuadrado
Variacin Libertad Cuadrados Medio F
SCR
CMR =
Regresin 1 SCR 1
CMR
SCE CME
CME =
Error n-2 SCE n- 2

Total n-1 SCT

Donde:

SCT = Y2
( Y )2
SCR = b2 X2
( X )2
n n

SCE = SCT - SCR

4. Decisin: Si F pertenece a la regin de aceptacin, entonces aceptar H0

5. Conclusin:
Con una confianza del (1-)%, si se acepta H 0 la variable predictora X no influye y
no hay relacin lineal entre ambas variables. En caso contrario, s existe una
relacin lineal entre ambas variables.

Gladys Enrquez Mantilla 226


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

En la tabla de ANOVA se verifica:

SCE SCR
SL = = CME r2 =
n2 SCT

En el ejemplo:

Con una confianza del 95%, se puede afirmar que las variaciones en el nmero de autos
vendidos se deben a fluctuaciones aleatorias que son independientes del nmero de
anuncios clasificados?

Solucin:

1. Hiptesis:

H0 : = 0
H1 : 0
7.71

2. Valor Crtico: F1 , 1, n 2 = F0.95 ,1, 4 = 7.71

CMR
3. Estadstica de Prueba: F = = 44.90
CME

Tabla de Anlisis de Varianza


Fuente de Grados de Suma de Cuadrado
F
Variacin Libertad Cuadrados Medio
Regresin 1 4740.96 4740.96
Error (residual) 4 422.37 105.59 44.90
Total 5 5163.33

Suma de cuadrados del total: (Variacin Total)

( Y)
2
5362
SCT = Y 2

n
= 53046
6
= 5163.33

Suma de cuadrados de regresin: (Variacin Explicada)


SCR = b
( X)
2
= 1.57682 2532

2
X 2

n 12575
6
= 4740.96

Suma de cuadrados del Error: (Variacin No Explicada)

SCE = SCT SCR = 5163.33 4740.96 = 422.37

4. Decisin: F = 44.90 RR Re chazar H 0 y Aceptar H1

5. Conclusin:
Con una confianza del 95% no se puede afirmar que las variaciones en el nmero de
autos vendidos se deben a fluctuaciones aleatorias independientes del nmero de
anuncios clasificados.

Gladys Enrquez Mantilla 227


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

En la salida anterior el Minitab nos mostr la tabla de Anlisis de Varianza siguiente:

P = 0.003 < = 0.05 Aceptar H1

PRUEBA DE HIPTESIS DE CORRELACIN

Despus de calcular el coeficiente de correlacin de Pearson debemos determinar si dicho


coeficiente es estadsticamente diferente de cero. Para dicho clculo se aplica un test basado
en la distribucin de la t Student.

H0 : 0 H0 : 0 H0 : = 0
H1 : < 0 H1 : > 0 H1 : 0

t , n 2 t1 , n 2 t1/2 , n 2

Estadstica de Prueba

r n2
t =
1 r2

Hiptesis:

H0 : 0 No existe correlacin lineal negativa entre X e Y.

H1 : < 0 Existe correlacin lineal negativa entre X e Y.

Hiptesis:

H0 : 0 No existe correlacin lineal positiva entre X e Y.

H1 : > 0 Existe correlacin lineal positiva entre X e Y.

Hiptesis:

H0 : = 0 No existe correlacin lineal entre X e Y.

H1 : 0 Existe correlacin lineal entre X e Y.

Gladys Enrquez Mantilla 228


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

En el ejemplo:

Con una confianza del 95%, se puede concluir que existe una correlacin lineal entre X e
Y?

1. Hiptesis:

H0 : = 0 No existe correlacin lineal entre X e Y.

H1 : 0 Existe correlacin lineal entre X e Y.

2. Valor Crtico:

t1 / 2 , n2 = t0.975 , 4 = 2.776

-2.776 +2.776
3. Estadstica de Prueba:
r n2 0.958217 4
t = = = 6.70
1 r2 1 0.958217 2

4. Decisin:
6.70 RR rechazar H 0 y aceptar H1

5. Conclusin:

Con una confianza del 95%, existe suficiente evidencia para concluir que hay una
asociacin lineal entre X e Y.

Estadsticas Estadsticas Bsicas Correlacin

Clic en Aceptar.

Gladys Enrquez Mantilla 229


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

REGRESIN Y CORRELACIN CUADRTICA

La parbola por lo general se aplica en aquellos casos en que se presenta una parte
ascendente y en seguida una descendente o viceversa.

En la prctica su uso es poco frecuente sin embargo a veces se utiliza para proyecciones de
utilidad, ingresos.

Ecuacin de Regresin Cuadrtica

Su grfico:

Y = a + b X + c X 2

Para hallar los valores de a, b y c se deben resolver las siguientes ecuaciones normales:

a n + b X + c X2 = Y
aX + b X2 + c X3 = X Y
a X2 + b X3 + c X 4 = X2 Y

Este sistema se puede resolver utilizando la regla de Cramer.

Coeficiente de correlacin cuadrtico

r =
a Y + b XY + c X2 Y n Y
Y2 n Y2

Error estndar de Estimacin cuadrtico

SC =
Y2 a Y b XY c X2 Y
n 3

Ejemplo:

En la una fbrica se tienen los siguientes datos correspondientes a las horas trabajadas (en
miles) que producen cierto producto (en unidades).

Horas Trabajadas : 1 2 4 5 7 8 8 9 10 12
Produccin : 25 15 10 10 15 10 20 20 35 45

a) Ajustar a los datos un modelo cuadrtico.


Y = a + b X + c X 2

Gladys Enrquez Mantilla 230


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Al reemplazar los valores en las ecuaciones normales, resulta:

205 = 10 a + 66 b + 548 c 10 66 548


1560 = 66 a + 548 b + 5022 c = 66 548 5022 = 1 337 672
14750 = 548 a + 5022 b + 48788 c 548 5022 48788

205 66 548
40 072 580
a = 1560 548 5022 = = 29.957
1 337 672
14750 5022 48788

10 205 548
10 578 600
b = 66 1560 5022 = = 7.908
1 337 672
548 14750 48788

10 66 205
1 043 220
c = 66 548 1560 = = 0.780
1 337 672
548 5022 14750

Y = 29.96 7.91 X + 0.78 X 2

b) Hallar el volumen de produccin esperado para 14 mil horas.

Si X = 14 Y = 29.96 7.91 14 + 0.78 142 = 72

c) Calcular el coeficiente de correlacin cuadrtico.

29.957 205 7.908 1560 + 0.780 14750 10 20.5 2


r = = 0.95
5425 10 20.5 2

Un modelo cuadrtico s es confiable es decir, se pueden realizar pronsticos,


porque el coeficiente de correlacin pertenece a la regin de confiabilidad.

d) Calcular el coeficiente de determinacin cuadrtico.

r 2 = 0.95 2 = 90%

El 90% de las variaciones que se producen en la produccin se pueden atribuir a las


variaciones producidas en el nmero de horas trabajadas, el 10% restante de estas
variaciones son debidas a otros factores que no fueron considerados en este caso o
se deben a efectos aleatorios.

e) Calcular el error de estimacin cuadrtico.

5425 29.95696 205 + 7.90822 1560 0.77988 14750


SC = = 4.096
7

En promedio los valores reales se alejan con respecto a la ecuacin de regresin


cuadrtica en aproximadamente 4 unidades.

Gladys Enrquez Mantilla 231


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Digitar los datos en dos columnas diferentes y luego:

Estadsticas Regresin Grfica de lnea ajustada

Clic en Opciones

Clic en Aceptar y luego en Aceptar.

Grfica de lnea ajustada


Produccion = 29,96 - 7,908 HorasTrab + 0,7799 HorasTrab**2

Regresin
60
IC de 95%
PI de 95%
50
S 4,09621
R-cuad. 90,4%
40 R-cuad.(ajustado) 87,6%
Produccion

30

20

10

0 2 4 6 8 10 12
HorasTrab

Gladys Enrquez Mantilla 232


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios
REGRESIN Y CORRELACIN EXPONENCIAL

Al graficar los valores X e Y se obtiene una curva creciente o decreciente, es decir que la
variable predictora evoluciona en forma aritmtica y la variable predictando evoluciona en
forma geomtrica. En la prctica son numerosas las variables que presentan un crecimiento
geomtrico: la poblacin, ventas, salarios, ingresos, etc.

Ecuacin de Regresin Exponencial:

Su grfico:

Y = a . b X

Para facilitar la determinacin de las ecuaciones normales, la funcin anterior se linealiza


aplicando logaritmos: Log Y = Log a + X log b
Ecuaciones normales:
log Y = n log a + log b .X
X log Y = log a . X + log b . X 2

Coeficiente de Correlacin Exponencial

r =
X log Y X . log Y
n

( n X2 ( X )2 ) ( n ( log y )2 ( log Y )2 )
Ejemplo:
La demanda de televisores (miles de unidades) y los gastos de publicidad (cientos de
dlares) en un pas desde 2006 hasta 2010 fue:
Gastos de Publicidad : 2 4 5 7 12
Demanda de TV : 3 6 12 24 45
a) Ajustar a los datos un modelo exponencial:

Y = a . b X aplicando logaritmos: Log Y = Log a + X log b

5.37 = 5 log a + 30 log b 5 30


= = 290
38.96 = 30 log a + 238 log b 30 238

5.37 30
38.96 208 109.26
log a = = = 0.38 a = 2.38
290 290

5 5.37
30 38.96 33.7
log b = = = 0.12 b = 1.31
290 290

Aplicando antilogaritmos, el modelo exponencial ser: Y = 2.38 1.31X

Gladys Enrquez Mantilla 233


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

b) Realizar un pronstico:

Si X = 13 Y = 2.38 . 1.3113 = 79.63 80 unidades

Cuando los gastos de publicidad sean de 1300 dlares, se espera que la demanda de
televisores sea 80 000.

c) Calcular el coeficiente de correlacin exponencial:


5 38.96 30 5.37
r = = 0.95 Es confiable.
(5 238 30 )(5 6.64 5.37 )
2 2

Digitar los datos en dos columnas diferentes y luego:

Calc Calculadora

Entonces en la columna C3
aparecern los logaritmos de la
columna C2.

A la columna C3, colocarle el ttulo:


LogY

Clic en Aceptar

Estadsticas Regresin Regresin

Al hacer clic en Aceptar el Minitab nos da la


ecuacin de regresin lineal (linealizada
mediante logaritmos):

Por lo tanto, aplicando antilogaritmos, se obtiene la ecuacin buscada:

Y = a . b X Y = 2.371374 1.306171X

Gladys Enrquez Mantilla 234


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

REGRESIN Y CORRELACIN MLTIPLE

En la mayor parte de los problemas que se generan en la industria en que se aplica el


anlisis de regresin, se requiere ms de una variable independiente en el modelo de
regresin. La complejidad de la mayora de los mecanismos cientficos es tal que, con objeto
de estar en condiciones de pronosticar una respuesta, se necesita un modelo de regresin
mltiple.

Por lo tanto, es razonable pensar que


puedan existir varias variables
independientes X i que contribuyan a
explicar la variable dependiente Y. Es
entonces cuando se utiliza el modelo de
regresin lineal mltiple.

Regresin Mltiple

En la regresin mltiple se trata de predecir una sola variable respuesta a partir de dos o
ms variables predictoras. Permite utilizar una mayor informacin disponible para estimar
la variable respuesta, de esta forma se trata de aumentar la precisin del estimado.

Y
 = f ( X1 , X 2 , .... , X p )
Variable  
dependiente Variables
independientes

Modelo de Regresin Mltiple:

Un modelo de regresin mltiple expresa una relacin lineal entre una variable dependiente
y dos o ms variables independientes ( X1 , X 2 , .... , X p ) .

Y = 0 + 1 X1 + 2 X 2 + .... + p X p + e i

i mide el cambio esperado en la variable respuesta Y cuando X i aumenta en una unidad y


el resto de las variables predictoras permanecen constantes.

El modelo de regresin lineal simple presenta dos componentes:

Gladys Enrquez Mantilla 235


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Ecuacin de Regresin para tres variables:

Los estadsticos a travs de los cuales estimaremos los valores de 0 , 1 y 2 vienen


dados por las expresiones de b 0 , b1 y b 2


Y = b0 + b1 X1 + b2 X2

Y : Variable predictando (dependiente o respuesta)


X1 y X 2 : Variables predictoras (independiente).
b0 : constante de regresin.
b1 y b 2 : coeficientes de regresin parcial.

La ecuacin de regresin lineal mltiple de


Y sobre X1 y X 2 en un sistema
tridimensional de coordenadas
rectangulares, representa un plano que se
llama plano de regresin y es una
generalizacin de la recta de regresin para
dos variables.

Esta ecuacin de regresin (plano de regresin) puede escribirse como:



Y = b 0.12 + b 01. 2 X1 + b 02.1 X 2
Donde:
Y : Vara parcialmente debido a la variacin unitaria de X1 y X 2
b 0. 12 : Es el intercepto del plano de regresin con el eje Y. Mide la variacin
de Y cuando X1 y X 2 permanecen constantes.
b 01. 2 : Es la pendiente asociada a X1 .
Indica el cambio (aumento o disminucin) que sufrir Y parcialmente
por cada variacin unitaria de X1 cuando X 2 permanece constante.
b 02. 1 : Es la pendiente asociada a X 2 .
Indica el cambio (aumento o disminucin) que sufrir Y parcialmente
por cada variacin unitaria de X 2 cuando X1 permanece constante.

El criterio de mnimos cuadrados localizar el plano que minimice la suma de los cuadrados
de los errores de estimacin, obtenindose las ecuaciones normales:
b0 n + b1 X1 + b2 X2 = Y
b0 X1 + b1 X12 + b 2 X1 X 2 = X1 Y
b0 X2 + b1 X1 X 2 + b 2 X 22 = X2 Y
Al resolver simultneamente estas ecuaciones por el mtodo de determinantes, se obtienen
los valores de b 0 , b1 y b 2 .

Supuestos del modelo de regresin lineal mltiple:

Si tenemos dos variables predictoras X1 y X 2 el modelo de regresin lineal mltiple


requiere las mismas condiciones que el modelo de regresin lineal simple.

Gladys Enrquez Mantilla 236


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Linealidad

Los datos deben satisfacer una relacin lineal. Los puntos se ajustan a un plano.

Si hay slo dos variables predictoras X1 y


X 2 entonces los datos deben estar
aproximadamente contenidos en un plano.

Para tres o ms variables predictoras, la ecuacin de regresin es un hiperplano y no


podemos visualizar los datos grficamente.

Homocedasticidad

La varianza debe ser constante:

Var ( e i ) = 2 , i :1, 2 , .... , n

La nube de puntos tiene el mismo grosor (su


aspecto es de una almohada plana y de
grosor constante).

Homogeneidad

El valor esperado o promedio de lo errores de estimacin e i es cero:

E( ei ) = 0 , i : 1, 2 , .... , n

Independencia

Los errores o residuos e i son variables aleatorias independientes. Es decir, una observacin
no debe dar informacin sobre las dems.

Normalidad

Los errores e i tienen distribucin normal: e i ~ N ( 0 , 2 ) .

Gladys Enrquez Mantilla 237


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Coeficientes de Correlacin Simple

Slo comparan dos variables, sin tener en cuenta la tercera. Miden la proporcin de la
varianza de Y explicada por X1 y X 2 exclusivamente.
r01 : Correlacin simple entre Y y X1
r02 : Correlacin simple entre Y y X 2
r12 : Correlacin simple entre X1 y X2

Coeficiente de Determinacin Mltiple: 0 R 20 . 12 1

Es una medida que representa la proporcin de la variacin total de Y que est explicada
por el plano de regresin es decir por la influencia conjunta de X1 , X 2 y por el azar.
Mide la tasa porcentual de los cambios de Y que pueden ser explicados por X1 y X2
simultneamente.

R 20 . 12 =
b0 Y + b1 X1 Y + b 2 X 2 Y n Y
2
Y2 nY

Coeficiente de Correlacin Mltiple: R 0 . 12

Expresa el grado de relacin existente entre tres a ms variables. Si todos los valores de las
variables, varan en forma proporcional ya sea directa o inversamente, es decir satisfacen
una ecuacin, se dice que las variables estn correlacionadas o que existe una relacin
entre ellas.

1 R 0 . 12 + 1

Error estndar de estimacin mltiple

La estimacin se hace ms precisa conforme el grado de dispersin alrededor del plano de


regresin se hace ms pequeo. El error estndar mltiple de la estimacin es la medida de
la eficiencia de la ecuacin de regresin. Se expresa en las mismas unidades que la variable
dependiente. Es difcil determinar cul es un valor grande y cul es uno pequeo para el
error estndar.

SM =
( Yi Yi )2
n p 1

Y : Valores observados en la muestra


Y : Valores estimados a partir a partir de la ecuacin de regresin
n : Nmero de datos
p : Nmero de variables independientes

Error estndar de estimacin para dos variables predictoras:

S Y , X1 , X 2 =
Y 2
b 0 Y b1 X1 Y b 2 X 2 Y
n3

Gladys Enrquez Mantilla 238


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Ejemplo:

La siguiente tabla muestra las ventas de un artculo (en cientos), los gastos de publicidad
por radio y los gastos de publicidad en peridicos (en miles de soles).
Gastos de publicidad en Gastos de publicidad en Ventas
radio (miles de soles) peridico (miles de soles) (cientos)
X1 X2 Y
4 1 7
7 2 12
9 5 17
12 8 20

a) Hallar el plano de regresin: Y = b0 + b1 X1 + b2 X2

X1 = 32 X 2 = 16 Y = 56

X12 = 290 X 22 = 94 Y 2 = 882


X1 Y = 505 X 2 Y = 276 X1 X 2 = 159
Las ecuaciones normales son:

4 b 0 + 32 b1 + 16 b 2 = 56
32 b 0 + 290 b1 + 159 b 2 = 505
16 b 0 + 159 b1 + 94 b 2 = 276

Usando el mtodo de Cramer se calculan: b 0 , b1 y b 2

4 32 16
= 32 290 159 = 236
16 159 94

56 32 16
505 290 159
276 159 94 152
b0 = = = 0.644
236 236

4 56 16
32 505 159
16 276 94 392
b1 = = = 1.661
236 236

4 32 56
32 290 505
16 159 276 4
b2 = = = 0.017
236 236

Y = 0.644 + 1.661 X1 + 0.017 X2

Gladys Enrquez Mantilla 239


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

b) Interpretar : b 0 , b1 y b 2

b0 = 0.644 64 unid. Es el incremento promedio en las ventas cuando los


gastos de publicidad en radio y los gastos de
publicidad en peridico permanecen constantes.

b1 = 1.661 166 unid. El promedio de ventas esperadas crece en aprox. 166


unidades cuando los gastos de publicidad en radio
aumentan en S/.1000, mantenindose constante los
gastos de publicidad en peridicos.

b2 = 0.017 2 unid. El promedio de ventas esperadas crece en aprox. 2


unidades cuando los gastos de publicidad en peridico
aumentan en S/.1000, mantenindose constante los
gastos de publicidad en radio.

c) Calculando el coeficiente de correlacin lineal mltiple.

0.644 56 + 1.661 505 + 0.017 276 4 142


R 0 .12 =
882 4 142

R 0 .12 = 0.987 Por lo tanto un modelo lineal s es adecuado.

d) Calculando el coeficiente de determinacin mltiple.

R 2 0 .12 = ( 0.987 )2 = 0.975 = 97.5%

Alrededor del 98% de la variacin total de las ventas se explica por medio de la
ecuacin de regresin.

e) Calcular los coeficientes de correlacin lineal: r12 , r13 , r23

r12 = 0.9875 r13 = 0.959 r23 = 0.9706

INFERENCIA RESPECTO A LOS PARMETROS

El contraste de hiptesis del modelo de regresin permite verificar si todas las variables
independientes tienen coeficientes significativos.

Hiptesis:
H 0 : 1 = 2 = 3 = .... = p
H1 : al menos uno de los i no es cero

Si se acepta H 0 significa que ninguna de las variables predictoras es relevante para explicar
los cambios de Y.

Gladys Enrquez Mantilla 240


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Digitar los datos en tres columnas diferentes.

Grfica Grfica de Superficie 3D

Clic en Aceptar.

Clic en Aceptar.

Grfica de superficie de Y vs. X3; X2

20

15
Y

10 7,5

5,0
X3
2,5
5,0
7,5
10,0 0,0
X2 12,5

Gladys Enrquez Mantilla 241


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Estadsticas Regresin Regresin

Clic en Aceptar.

Para hallar los coeficientes de correlacin lineal simple:

Estadsticas Estadsticas Bsicas Correlacin

Clic en Aceptar.

Gladys Enrquez Mantilla 242


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

SELECCIN DE VARIABLES EN REGRESIN MLTIPLE

Mtodo Paso a Paso (Stepwise)

En el paso inicial se incluye en el modelo a todas las variables predictoras y en cada paso se
va eliminando las variables que dan el P-Value ms grande o el valor de t en valor absoluto
menor que 2. Una variable que es eliminada del modelo ya no puede volver a entrar en un
paso subsiguiente. El proceso termina cuando todos los P-Values son menores que 0.05
cuando todos los valores de t en valor absoluto son mayores que 2.

Aplicar el mtodo Stepwise para elegir el mejor modelo teniendo en cuenta que se tienen las
siguientes variables:
Y : Medida de severidad de la enfermedad respiratoria.
X 2 : Aos de educacin.
X 3 : Nmero de personas en el edificio donde vive la persona.
X 4 : Medida de la calidad del aire (un nmero grande indica pobre calidad).
X 5 : Nivel de nutricin.
X 6 : 0 es no fuma y, 1 s fuma.

Y X2 X3 X4 X5 X6
40 7 25 22 94 0
67 7 33 61 18 1
30 6 19 30 103 0
71 15 29 50 17 1
47 11 21 43 109 0
53 10 24 54 0 1
39 8 21 28 33 0
55 14 22 35 21 1
47 10 26 22 76 0
56 9 32 43 97 1
43 8 22 48 104 0
41 8 19 27 -37 0
51 9 28 32 87 1
48 8 22 62 131 0
36 8 19 37 53 0

Ingresar la matriz de datos en columnas diferentes del Minitab.

Estadsticas Regresin Paso a Paso

Gladys Enrquez Mantilla 243


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

Clic en Methods

Clic en Aceptar y luego


en Aceptar.

Regresin paso a paso: Y vs. X2; X3; X4; X5; X6

Alfa a entrar: 0,15 Alfa a retirar: 0,15

La respuesta es Y en 5 predictores, con N = 15

Paso 1 2
Constante -16,14 -12,17 valor de la constante: b1 = 12.17

X2 1,95 1,82 b 2 = 1.82


Valor T 8,08 8,44
Valor P 0,000 0,000

X3 1,60 1,46 b 3 = 1.46


Valor T 9,26 12,28
Valor P 0,000 0,000

X4 0,293 0,279 b 4 = 0.279


Valor T 6,94 6,81
Valor P 0,000 0,000

X5 -0,048 -0,042 b 5 = 0.042


Valor T -4,05 -3,90
Valor P 0,003 0,003

X6 -2,2
Valor T -1,13
Valor P 0,288

S 1,88 1,91
R-cuad. 98,15 97,89
R-cuad.(ajustado) 97,13 97,05
Cp de Mallows 6,0 5,3

Y = 12.17 + 1.82 X 2 + 1.46 X 3 + 0.279 X 4 0.042 X 5

Este mismo modelo se puede hallar, eliminando la variable X 6 y considerando slo las
dems variables.

Gladys Enrquez Mantilla 244


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

PRCTICA N 6
Regresin y Correlacin Lineal, Cuadrtica, Exponencial y Mltiple

1.- Una compaa presenta los siguientes datos con respecto a las ventas de un
producto durante siete aos.

Aos : 2003 2004 2005 2006 2007 2008 2009


Ventas : 36 28 34 52 58 62 67

a) Ajustar a los datos un modelo parablico.


b) Se puede afirmar que el modelo hallado ser eficiente para realizar
pronsticos?
c) Si tuvieras que elegir entre un modelo lineal y uno parablico. Por cul te
decidiras?
d) Interpretar a , b y c.
e) Qu porcentaje de los cambios producidos en las ventas, no es explicado
por el modelo parablico?
f) Estimar las ventas para el ao 2015.

2.- Un fabricante quiere establecer si hay una relacin parablica entre las ausencias al
trabajo. X: nmero de permisos al mes e Y: edad del trabajador. Para ello selecciona
una muestra aleatoria de 10 trabajadores, obteniendo la siguiente informacin:
Y : 28 32 46 24 28 36 42 37 51 42
X : 5 8 4 7 10 4 3 4 3 4
a) Hallar la ecuacin de regresin parablica.
b) Estimar la edad para una persona que solicita 6 permisos en el mes.
c) Es un modelo parablico, el ms adecuado? por qu?
d) Qu porcentaje de los cambios que se producen en la variable predictando se
pueden atribuir a otros factores o al azar?
e) Si se usa un modelo lineal, se puede afirmar que los cambios de la
predictando se deben a los cambios en la predictora?

3.- Se tienen los siguientes datos correspondientes a las horas de estudio y al nmero
de errores cometidos en un examen de Estadstica Aplicada por un grupo de
alumnas del IV ciclo de Negocios Internacionales de la Unif.
Horas de estudio : 5 2 9 6 7 3 4 8
N de errores : 7 14 6 7 5 8 10 4
N de alumnas : 3 1 5 3 3 1 2 4
a) Podemos afirmar que los pronsticos que realicemos con este modelo
estarn cercanos a la realidad? Por qu?
b) Podemos afirmar que las variaciones que se producen en la variable
predictando se pueden atribuir a efectos aleatorios? Por qu?
c) Qu porcentaje de las variaciones en el nmero de errores se deben a los
cambios que se producen en las horas de estudio?
d) Qu tanto se alejan los puntos del diagrama de esparcimiento con respecto a
la recta de regresin? 1.4738
e) Cuntos errores espera cometer como mximo, un alumno que dedica 12
horas al estudio? 5.331
f) Qu se puede decir acerca de la pendiente del modelo de regresin
poblacional? Obtener una conclusin altamente significativa.
-1.32 ; -0.46

Gladys Enrquez Mantilla 245


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

4.- Una compaa recab los datos adjuntos para comparar el precio de venta de casas
nuevas con el tamao de la construccin en cientos de pies cuadrados.
Espacio construido : 20 22 18 30 23 25
Precio de venta : 116 118 91 145 105 121
a) Podemos afirmar que a mayor espacio construido mayor precio de venta?
Justifique su respuesta.
b) Hallar un intervalo altamente significativo para el coeficiente de regresin.
c) Si el espacio construido es de 32 cul es el precio de venta mnimo y
mximo que se espera?
d) Con un nivel del 10%, hallar un intervalo para el precio de venta promedio, si
el espacio construido es 35.
e) Qu tan alejados estn los valores reales con respecto a los valores
estimados?

5.- Se tiene la siguiente informacin con respecto a la produccin total (miles de


unidades) y el costo total (miles de dlares) de cierto artculo en una compaa.
Costo total : 30 36 40 48 50 54 66 88
Produccin : 10 20 30 40 50 60 70 80
a) Ajustar a los datos un modelo exponencial.
b) Podemos afirmar sin temor a equivocarnos que un modelo exponencial sera
de mayor utilidad que un modelo lineal? Justifique.
c) Si se tiene una produccin de 53000 unidades, cul ser el costo total
esperado? Use el mejor modelo.
d) Qu porcentaje de los cambios en Y se pueden atribuir a otras variables o a
efectos aleatorios?

6.- Los siguientes datos son las puntuaciones obtenidas por un grupo de alumnos en
dos tests, que se quieren utilizar como previsores de la calificacin media de los
alumnos en el rea de Lenguaje y las calificaciones medias reales obtenidas por
dichos alumnos, ms tarde, en su curso de lenguaje.
Calificac. : 8,8 5,5 8,7 6,8 6,5 8,7 8,4 9,7 5,8
Test 1 : 8,9 4,9 8,6 6,3 5,0 8,0 8,7 9,4 5,5
Test 2 : 9,2 5,6 9,0 6,7 6,2 8,5 9,0 9,9 6,0
a) Calcular e interpretar: r12 r13 r23
0,9664 0,9862 0,9920
b) Hallar el plano de regresin.
c) Se puede afirmar que un modelo de regresin mltiple explica la relacin
entre la variable predictando y las variables predictoras? Por qu?
d) Se puede decir que hay una asociacin lineal entre la variable predictando y
la mejor predictora?
e) Qu tanto se alejan los valores observados con respeto a la recta de
regresin?

7.- Se tienen las estaturas (pulgadas) de un grupo de padres y sus hijos mayores.
Padres : 65 63 64 68 62
Hijos : 68 66 68 69 66
a) Podemos afirmar que existe una relacin inversa entre la estatura de los
padres y sus hijos? Por qu?
b) Hallar los valores mnimo y mximo para el verdadero cambio de la variable
predictando cuando la variable predictora aumenta una unidad.
c) Cul ser la estatura promedio de los hijos, si se sabe que la estatura de los
padres es 70 pulgadas?

Gladys Enrquez Mantilla 246


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

8.- Se ajust el siguiente modelo de regresin con una muestra de 30 familias para
explicar el consumo familiar de leche.
Yi = + 1 X1 + 2 X 2 + e i
donde:
Yi : consumo de leche en litros por semana.
X1 : ingreso semanal, en cientos de dlares.
X2 : tamao de familia.

La estimacin de mnimos cuadrados de los parmetros de regresin fue:


a = 0.025 b1 = 0.052 b 2 = 1.14

a) Interpretar las estimaciones b1 y b 2


b) Es posible hacer una interpretacin con sentido de a ?
a) Si se sabe que la suma de cuadrados total y la suma de cuadrados del error
fueron: SCT = 162.1 y SCE = 88.2
Hallar e interpretar el coeficiente de determinacin y el coeficiente de
correlacin mltiple.

9.- Una compaa desea determinar si el nmero de anuncios transmitidos por


televisin estn correlacionados linealmente o no con las ventas de su producto,
para lo cual obtuvo la siguiente informacin de algunas ciudades.
Ciudad : A B C D E F G
N comerciales TV : 12 6 9 15 11 15 8
Unidades vendidas : 7 5 10 14 12 9 6
a) Se puede afirmar que existe una relacin lineal entre estas dos variables?
b) Hallar la ecuacin de un modelo lineal. Interpretar a y b.
c) Podemos afirmar que las variaciones en las unidades vendidas resultan de
fluctuaciones aleatorias que son independientes del nmero de comerciales
de TV?
d) Estaras dispuesto a invertir en publicidad? Por qu?
e) Con una confianza del 99%, qu podemos afirmar acerca del cambio que se
produce en las unidades vendidas cada vez que se incremente en uno el
nmero de comerciales de TV?
f) Si se anuncian 17 comerciales en la TV, cuntas unidades se espera vender?
Usar un nivel del 90%.
g) En promedio, cuntas unidades se espera vender si se sabe que en la TV se
han anunciado 20 comerciales?

10.- Para los siguientes datos correspondientes a las ventas de un producto durante el
periodo 2003-2009:
Aos : 2003 2004 2005 2006 2007 2008 2009
Ventas : 545 755 919 1200 1600 2500 4200

a) Ajustar a los datos una curva exponencial.


b) Estimar las ventas para los aos 2013 y 2017.
c) Se puede afirmar que estos pronsticos son cercanos a la realidad? Por
qu?
d) Calcular los errores de estimacin para cada ao.
e) Qu tanto explica el modelo de regresin hallado, la relacin entre las
variables predictora y predictando?
f) En este caso, sera ms apropiado un modelo lineal o un modelo
exponencial? Por qu?

Gladys Enrquez Mantilla 247


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

11.- El departamento de contabilidad de una fbrica de papel desea estimar la cantidad


mensual de gastos generales de la fbrica (gastos indirectos de produccin, en miles
de dlares). En el pasado, la firma ha estimado estos gastos sobre la base del
nmero esperado de horas directas de trabajo. En los ltimos aos, sin embargo, los
gastos estimados se han vuelto un predictor errtico de los gastos reales. Como
resultado, la firma est buscando otro factor con el cual se pueda mejorar la
ecuacin de estimacin. El departamento de contabilidad mantiene un historial del
nmero de horas (en cientos) durante las cuales han estado en produccin las
mquinas de la firma. Se tienen los siguientes datos para los ltimos diez meses.
Y : Gastos generales actuales de la fbrica (miles de dlares)
X1 : Horas de trabajo directas (en cientos)
X2 : Horas de mquina (en cientos).

Y : 29 24 27 25 26 28 30 28 28 27
X1 : 45 42 44 45 43 46 44 45 44 43
X2 : 16 14 15 13 13 14 16 16 15 15
a) Se puede combinar esta informacin con los datos de horas de trabajo
directas y obtener una ecuacin de estimacin ms precisa para los gastos
generales de la fbrica?
b) Si quisieras hallar un modelo lineal, cul variable descartaras? Por qu?
c) Se podra afirmar que los cambios que se producen en la variable
predictando se pueden atribuir a los cambios de la mejor variable predictora?
d) En cunto se alejan los puntos del dispersigrama con respecto a la recta de
regresin?
e) Al hallar un modelo lineal, se puede decir que la relacin es directa? Por
qu?
f) Hallar un intervalo para el gasto promedio.

12.- Se desea hacer un estudio para examinar el papel que juega la televisin en la vida
de un grupo preseleccionado de personas de edades superiores a los 65 aos. El
propsito de dicho estudio es proporcionar informacin que permita hacer una
programacin adecuada a las necesidades de este grupo. Una muestra aleatoria de
siete personas de edades superiores a los 65 aos fue seleccionada y a cada persona
le fue solicitada la siguiente informacin:
N de horas TV : 0.5 0.8 0.9 1.6 2.8 3.0 3.3
Edad : 73 65 69 81 71 75 79
Escolaridad (aos) : 14 10 10 12 12 6 6

a) Hallar el plano de regresin. Interpretar los coeficientes de regresin.


b) Calcular los residuos.
c) Qu tan alejados se encuentran los valores reales con respecto al plano de
regresin?
d) Qu tanto explica el plano de regresin hallado, las variaciones de la variable
predictando teniendo en cuenta las variaciones de las dos predictoras?
e) Cul de las dos variables predictoras, explican mejor la variabilidad de la
variable predictando?
f) Sera confiable un modelo lineal usando nicamente la mejor variable
predictora? Si es as encuentre dicho modelo.
g) Usando un modelo lineal, realizar un pronstico con un nivel del 1%.
h) Qu tanto se alejan los valores observados con respecto a los valores
estimados?
i) Se puede afirmar que a medida que aumenta la variable predictora, se
espera que la variable predictando tambin crezca. Por qu?

Gladys Enrquez Mantilla 248


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

13.- Las pruebas acerca del consumo de combustible de un vehculo que viaja a
diferentes velocidades produjeron los siguientes resultados:
Velocidad : 20 30 40 50 60 70 80
Consumo : 18.3 18.8 19.1 19.3 19.5 19.7 19.8
a) Qu porcentaje de las variaciones en el consumo se pueden atribuir a otros
factores o a efectos aleatorios?
b) Con una confianza del 99%, se puede afirmar que un modelo lineal explica
la relacin existente entre velocidad y consumo?
c) Con una confianza del 90%, cul sera el mximo valor esperado para el
coeficiente de regresin poblacional?
d) Con una confianza del 99%, cunto se espera que sea el consumo promedio
si se sabe que la velocidad es 85?
e) Podemos concluir que hay una asociacin lineal entre ambas variables?

14.- El gerente de personal de una empresa considera que puede haber una relacin
entre el ausentismo (das), Salario (en miles de soles) y la edad (aos). Selecciona una
muestra aleatoria de 8 empleados, con los resultados siguientes:
Das ausente : 15 6 10 18 9 7 14 11
Edad : 27 61 37 23 46 58 29 36
Salario : 8.5 16.4 14.3 8.0 14.7 14.0 11.2 15.3
a) Encontrar los coeficientes de regresin mltiple.
b) Interprete el significado de las pendientes.
c) Predecir el nmero de das de ausencia de un empleado de 40 aos de edad
que gana S/ 13 000 al ao.
d) Sera adecuado un modelo lineal, usando la mejor variable predictora?
e) Hallar dicho modelo lineal, si fuera confiable.
f) Usando dicho modelo, realizar una estimacin intervlica.
g) Qu tanto se alejan los puntos del diagrama de esparcimiento con respecto
al plano de regresin?

15.- Se tienen los siguientes datos:


Temperatura (C) : 10 15 20 25 30 34
N de helados vendidos : 5 12 24 38 70 130
a) Trazar el diagrama de esparcimiento.
b) Hallar el modelo ms adecuado.
c) Si la temperatura es 32 C, cunto se espera que sea el promedio de helados
vendidos?
d) Cada vez que la temperatura se incremente en un grado cunto se espera
que cambie en promedio la cantidad de helados vendidos?

16.- Los siguientes datos corresponden a las horas de estudio para una prueba y al
nmero de respuestas correctas obtenidas en dicha prueba por 17 alumnos.
Horas de estudio : 1 5 6 2 7 3
Respuestas correctas : 2 11 20 10 14 12
N de alumnos : 1 3 4 3 4 2
a) Si un modelo lineal es confiable, hallar un pronstico altamente significativo e
interpretarlo.
b) Qu tipo de relacin existe entre las variables involucradas? Por qu?
c) Calcular los errores de estimacin.
d) Cul ser el valor mximo esperado para el verdadero coeficiente de
regresin?
e) En cunto se alejan los valores observados con respecto a los valores
estimados?

Gladys Enrquez Mantilla 249


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

17.- Los siguientes datos indican las ventas mensuales (en miles de soles) y los aos de
experiencia en ventas de diez vendedores de una fbrica.

A.E. : 4 5 2 5 6 7 1 8 3 7
Ventas : 5 6 4 5 7 10 3 11 4 9

a) Hallar un modelo de regresin cuadrtico.


b) Podemos afirmar que una curva parablica expresa adecuadamente la
relacin entre las variables consideradas? Por qu?
c) Cunto se ganar en confiabilidad si se elige el mejor modelo entre un
cuadrtico y un lineal?
d) A qu distancia se encuentran los puntos del dispersigrama con respecto a
la curva de regresin hallada?

18.- Una compaa asigna diferentes precios a un equipo de sonido particular en ocho
regiones diferentes del pas. Los siguientes datos muestran el nmero de unidades
vendidas y los precios correspondientes (en miles de soles).
Ventas : 5 8 10 13 16 22 28
Precio : 15 7 3 6 14 36 62
a) Se puede afirmar que el modelo parablico es el mejor ajuste?
b) Hallar el modelo de regresin parablico.
c) Se puede afirmar que los pronsticos que se realicen usando el modelo
parablico sern acertados? Por qu?

19.- Se realiz un estudio para determinar los efectos de no dormir en la capacidad de las
personas para resolver problemas sencillos. Un grupo de personas particip en el
estudio que consisti en dar a cada persona, despus de un periodo especfico sin
dormir, un conjunto de problemas sencillos de sumar y se registr el nmero de
errores. Se obtuvieron los siguientes resultados:
N.de errores : 9 6 8 14 16
N.horas sin dormir : 8 12 16 20 24
N. de personas : 3 2 3 4 5
a) Se puede afirmar que existe una relacin directa entre nmero de errores y
nmero de horas sin dormir? Explique el significado en este caso.
b) Hallar el plano de regresin.
c) Realizar un pronstico e interpretarlo.
d) Hallar un modelo lineal usando la mejor predictora. Interpretar a y b.
e) Los cambios que se producen en Y, se pueden atribuir a los cambios que
suceden en la mejor predictora?
f) Si la variable predictora se incrementa en una unidad, qu podemos esperar
que suceda con la variable predictando?

20.- Los siguientes datos corresponden al grado de ansiedad de un grupo de alumnos


elegidos aleatoriamente en cierta universidad y sus calificaciones.
Ansiedad : 8 10 12 16 14 18 22 23 19 26
Calificacin : 7 10 8 9 6 5 5 6 8 7
a) Se puede afirmar que a mayor nivel de ansiedad, calificaciones ms bajas y
a la recproca?
b) Qu calificacin cabe esperar partiendo de una ansiedad de 20 puntos?
Obtener una conclusin altamente significativa.
c) Para una ansiedad de 25 puntos, cunto se espera que sea en promedio la
calificacin?
d) Cul ser el cambio que se produce en la calificacin, cuando la ansiedad se
incremente en un punto?

Gladys Enrquez Mantilla 250


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

21.- A continuacin se presentan los datos obtenidos en un estudio realizado por una
cadena de supermercados para determinar la eficiencia de varios soportes
publicitarios sobre ventas. Los datos fueron obtenidos de las ventas semanales (en
miles de soles), de los gastos publicitarios en revistas, en televisin, en radio y en
boletines volantes distribuidos en casas.
Ventas : 365 649 441 807 450 828 314 472
Revista : 61 48 56 62 41 69 73 88
TV : 36 40 14 28 31 21 36 38
Radio : 13 7 8 6 3 0 5 6
Volante : 32 36 41 34 33 32 7 8
a) Sobre cul soporte publicitario se debera invertir? Por qu?
b) Hallar el modelo de regresin que permita estimar las ventas, teniendo en
cuenta los dos soportes publicitarios ms eficientes.
c) Qu porcentaje de las variaciones en las ventas se pueden atribuir a otros
factores o al azar?
d) Realice e interprete un pronstico.
e) Utilizando el mtodo paso a paso, hallar el mejor modelo de regresin.

22.- Se tienen los datos correspondientes a las calificaciones en una prueba de


inteligencia, el nmero de clases perdidas y las calificaciones en el curso de
Estadstica Aplicada de un grupo de alumnas del IV ciclo de Negocios
Internacionales de la Unif.
Prueba de Inteligencia : 50 54 62 70 75 80 90
Calific. Estadstica : 7 12 13 17 18 19 20
Clases perdidas : 6 7 5 2 1 3 2
a) Estimar la calificacin de estadstica de una estudiante que ha perdido 4 clases
y tiene una puntuacin de 60 en la prueba de inteligencia.
b) Qu tanto de los cambios en la variable predictando son explicados por el
plano de regresin?
c) Encuentre un modelo lineal usando la mejor variable predictora.
d) Se puede afirmar que los cambios de la variable predictando se pueden
atribuir a los cambios de la variable predictora? Por qu?
e) Realizar un pronstico al nivel del 5% e interpretarlo.
f) Si la variable predictora se incrementa en una unidad, cul ser el cambio
que se producir en la variable predictando?

23.- Una firma cree que sus ingresos anuales dependen de sus gastos por investigacin.
Se tiene la informacin de los ltimos seis aos (en miles de dlares).
Ingreso Anual : 31 40 30 34 25 20
Gastos en Investigacin : 5 11 4 5 3 2
a) Qu tipo de relacin existe entre el ingreso anual y los gastos en
investigacin? Por qu?
b) Podemos afirmar que existe una asociacin lineal entre ambas variables?
c) Se puede concluir que los cambios que se producen en la variable predictando
son atribuibles a los cambios de la variable predictora?
d) Para un gasto de investigacin de $8000, cunto se espera que sea el ingreso
anual promedio? Usar un nivel del 10%.
e) Si en investigacin se tuvo un gasto de $6000, cul ser el ingreso anual
esperado?
f) Al incrementarse el gasto en $1000, qu cambio se producir en el ingreso
anual?

Gladys Enrquez Mantilla 251


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

24.- La empresa "Autos S.A.", fabricante de automviles, vende stos por medio de
distribuidores repartidos en todo el pas. El gerente de dicha compaa, ha logrado
desde el ao 2005 un crecimiento de las ventas de 28%. Muy orgulloso de este
resultado, lo atribuye sobre todo a la experiencia de sus vendedores. El ha
recolectado los siguientes datos mensuales de ventas en unidades y del nmero de
vendedores:
Ventas (unidades) : 25 35 33 44 28 20
N de vendedores : 7 12 9 16 10 6

a) El gerente concluye que el 95% de la variacin de las ventas son explicadas


por la variacin del nmero de vendedores, razn por la cual propone al
Director, contratar ms vendedores. Es vlida la conclusin del gerente?
Explique por qu.
b) Se afirma que por cada vendedor que se contrate, el nmero de unidades
vendidas se incrementar. Es correcta la afirmacin? Por qu?
c) Se puede concluir que ambas variables estn relacionadas en forma lineal?
d) Si se usa un modelo lineal para realizar pronsticos, sern acertados estos
pronsticos?

25.- Se intenta estudiar la relacin existente entre el nmero de aos de afiliacin a un


partido poltico, la motivacin por pertenecer a ese partido y el nivel de satisfaccin
con dicho partido. Para ello se parte de los datos de ocho individuos tomados al
azar.
Satisfaccin : 6 7 4 9 10 9 9 5
Aos de afiliacin : 8 7 10 3 6 13 4 12
Fuerza motivacin : 4 5 3 7 8 8 9 2
a) Calcular e interpretar:
r12 r13 r23 -0,256 0,8735 -0,2753
b) encontrar la ecuacin del plano de regresin de Y sobre X1 y X2
c) Estimar la satisfaccin de una persona que lleva 9 aos afiliada a su partido
poltico y tiene una motivacin de 7.
d) Qu porcentaje de los cambio que se producen en Y, se pueden atribuir a
otros factores o al azar?
e) Si tuvieras que descartar una de las variables predictoras, cul sera? Por
qu?
f) La mejor predictora est linealmente asociada con la predictando?

26.- En una investigacin sobre la relacin que existe entre el nmero de veces que se
repite una tarea y los errores que se cometen se ha constatado la relacin curvilnea
existente entre ambas variables.
Veces repite : 6 8 11 13 16 17 18
N errores : 26 18 10 8 6 4 2
a) Hallar la ecuacin de regresin exponencial de la variable Y sobre X.
b) Realizar e interpretar un pronstico, usando el modelo hallado.
c) Los pronsticos que se realicen usando este modelo, sern cercanos a la
realidad? Por qu?
d) Si una tarea se repite 15 veces, cuntos errores se espera cometer en
promedio?
e) Por cada vez que se repita una tares, cmo variar el nmero de errores?
f) Cuntos errores se espera cometer, si la tarea se ha repetido diez veces?
g) Los cambios que se producen en el nmero de errores, los podemos atribuir
a los cambios en el nmero de veces que se repite la tarea?
h) Se puede afirmar que la relacin que hay entre ambas variables es lineal?

Gladys Enrquez Mantilla 252


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

27.- Considerando la evolucin del producto bruto interno de un pas (millones dlares)
desde el ao 2002 al 2009 fue:

Aos P.B.I. a) Hallar la ecuacin de tendencia


exponencial.
2002 2
2003 4 b) Calcular e interpretar el coeficiente de
2004 3 Correlacin.
2005 5
2006 6 c) Hallar la proyeccin del producto bruto
2007 6 Interno de los cinco aos siguientes.
2008 5
2009 8

28.- La demanda de televisores (miles de unidades) y los gastos de publicidad (cientos de


dlares) en un pas, desde 2003 hasta 2009 fue:
Demanda : 50 60 68 88 125 135 184
Publicidad : 1.1 2.0 3.0 3.8 5.0 5.5 6.5
a) Si tuvieras que elegir entre un modelo lineal y un modelo exponencial, cul
crees que sera de mayor utilidad? Por qu?
b) Hallar dicho modelo.
c) Realizar e interpretar un pronstico.
d) Calcular los residuos.
e) Qu tanto de los cambios en la variable predictando se pueden atribuir a los
cambios de la variable predictora?

29.- Se tienen los siguientes datos que corresponden al espritu de iniciativa personal en
las situaciones de solucin de problemas. Se tom una muestra aleatoria de
ingenieros de sistemas.
Iniciativa Personal : 9 11 10 14 18 16 19 24
Madurez Emocional : 10 10 18 15 20 16 22 20
Seguridad en s mismo: 8 12 15 17 23 21 26 35
a) Si tuviera que hallar un modelo slo con una variable predictora, a cul
elegiras? Por qu?
b) Hallar un modelo lineal adecuado usando la mejor variable predictora.
c) Se puede afirmar que tanto la variable predictando como la variable
predictora, varan en el mismo sentido? Explica.
d) Podemos afirmar que la variacin de Y se puede atribuir a la variacin de X,
o se debe a fluctuaciones aleatorias?
e) Hallar la ecuacin del plano de regresin.
f) Qu puntaje se esperara en Iniciativa Personal para un ingeniero que tiene
30 en seguridad en s mismo y 19 en Madurez Emocional?

30.- Las calificaciones de un grupo de estudiantes en su reporte de medio ao y los


exmenes finales fueron las siguientes:
Medio Ao : 77 50 71 72 81 94 96
Final : 82 66 78 34 47 85 99
a) Encontrar un modelo lineal. Interpretar a y b.
b) Realizar un pronstico al nivel del 99%.
c) Cul ser el valor mximo esperado para el verdadero cambio de la variable
predictando cada vez que la variable predictora se incrementa en una unidad?
d) Si la calificacin a medio ao es 85, cunto se espera que sea la nota
promedio del examen final?

Gladys Enrquez Mantilla 253


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

31.- Los siguientes datos corresponden a los CI verbal y no verbal as como las
calificaciones en Ingls, de un grupo de estudiantes del IV ciclo de ingeniera de
sistemas.
Calificacin : 70 60 80 95 90
CI Verbal : 110 90 100 140 120
CI No Verbal : 120 92 104 135 118
a) Calcular e interpretar el coeficiente de correlacin mltiple R1.23
b) Qu porcentaje de los cambios en las calificaciones lo podemos atribuir a los
cambios de ambas variables predictoras?
c) Hay una asociacin lineal entre las calificaciones y la mejor predictora? Usar
un nivel del 10%.
d) Si la variable predictora toma el valor 95, cunto se espera que sea la
calificacin promedio? Obtener una conclusin altamente significativa.
e) Qu tan alejados se encuentran los puntos del dispersigrama con respecto a
un modelo de regresin lineal?

32.- El departamento de ventas de una compaa desea hallar un modelo exponencial


que le permita estimar la demanda (en miles de dlares) de refrigeradoras para los
prximos aos, tomando en cuenta los datos histricos decrecientes desde el ao
2003 hasta 2009.
Demanda : 550 400 250 200 100 70 90
Aos : 2003 2004 2005 2006 2007 2008 2009

a) Hallar un modelo exponencial que se ajuste a los datos.


b) Podemos confiar en el modelo encontrado para realizar buenos pronsticos?
c) Cul ser la demanda esperada para los aos: 2012 y 2015?
d) Qu tanto de los cambios en la variable predictando, lo podemos atribuir a
los cambios de la variable predictora?

33.- Un psiclogo experimental afirma que en un experimento controlado, cuanta ms


edad tenga un nio tanto menor ser su nmero de respuestas irrelevantes. Los
siguientes datos fueron recopilados para comprobar su aseveracin.
Edad : 2 4 5 6 6 7 9 9 10 12
N Rptas.Irrelev. : 12 13 9 7 12 8 6 9 7 5
a) Parece vlida la afirmacin del psiclogo?
b) Hallar la ecuacin de un modelo lineal, slo si es confiable.
c) Influye la variable predictora sobre la variable predictando?
d) Hallar los lmites esperados para el verdadero cambio que se produce en la
variable predictando cuando la predictora se incrementa en una unidad.
e) Realiza e interpreta un pronstico altamente confiable.
f) Calcular los errores de estimacin.
g) Si tuvieras que decidir entre un modelo lineal y un exponencial, cul
elegiras y por qu?

34.- Para los siguientes datos:

Meses N turistas
Enero 13 a) Ajustar a los datos un modelo de
Febrero 17 Regresin parablica.
Marzo 38
Abril 42 b) Calcular el coeficiente de correlacin.
Mayo 40
Junio 34 c) Estimar cuntos turistas se espera recibir
Julio 30 para el mes de diciembre.

Gladys Enrquez Mantilla 254


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

35.- En un estudio sobre el efecto que produce el aire acondicionado en oficinas, se


obtuvieron los siguientes datos correspondientes a la temperatura (C) y el nmero
de errores cometidos por un radiotelegrafista en una hora.
Temperatura : 26 28 35 30 27
N de errores : 12 10 14 13 9
a) Hallar los modelos de regresin de Y sobre X.
b) Qu tipo de relacin existe entre ambas variables? Por qu?
c) Los cambios en el nmero de errores, lo podemos atribuir a los cambios
producidos en la temperatura?
d) Si la temperatura es 38C, cuntos errores se espera cometer en promedio?
Obtener una conclusin altamente significativa.

36.- Una compaa desea encontrar un modelo que explique la relacin existente entre la
produccin (miles de unidades por ao) y el costo marginal de produccin (dlares
por unidad).
Produccin : 5 7 9 9 11 12 12 14 16
Costo Marg. : 20 60 60 100 120 120 180 240 280
a) El asesor estadstico de la compaa asegura que el modelo que mejor describe
la relacin entre estas dos variables es un modelo exponencial, ests de
acuerdo con l? Por qu?
b) Hallar la ecuacin del modelo ms adecuado.
c) Si el modelo lineal es el mejor, realiza e interpreta un pronstico en forma de
intervalo.

37.- Se tienen los datos correspondientes a las edades (aos), los ingresos (dlares) y el
nmero de aos desde que salieron de la universidad de un grupo ingenieros de
sistemas que trabajan para la misma institucin.

Edad : 57 60 45 42 36 45 62 36 52
N de aos : 13 19 14 16 12 16 25 10 18
Ingresos : 512 650 550 500 540 680 680 456 590
a) Hallar un modelo lineal usando la mejor variable predictora.
b) Qu tipo de relacin existe entre ambas variables? Por qu?
c) Hallar el plano de regresin de Y sobre X1 y X2
d) Interpretar b1 y b2
e) Qu tanto explican a la variable predictando ambas variables predictoras en
forma conjunta?
f) Qu tanto se alejan los puntos del dispersigrama con respecto al plano de
regresin?

38.- Los siguientes datos son los ingresos por ventas mensuales, en centenas de $ que
obtuvo una compaa.
Mes : 1 2 3 4 5 6 7 8 9 10
Ingresos : 31 43 61 85 118 164 228 316 444 611
a) Podemos afirmar que un modelo exponencial es el ms adecuado en este
caso? por qu?
b) Encuentre la ecuacin del modelo ms adecuado.
c) Realice un pronstico puntual e interprete.
d) Calcular los valores estimados y los errores de estimacin.
e) Usando un modelo lineal, qu tan lejos estn los puntos del diagrama de
dispersin con respecto al modelo hallado?
f) Influye linealmente la variable predictora sobre la variable predictando.
g) Qu porcentaje de los cambios de Y no son explicados por un modelo lineal?
h) Hallar el valor mnimo esperado para el coeficiente de regresin.

Gladys Enrquez Mantilla 255


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

39.- Un fabricante de juguetes que vende su produccin en ms de cien distritos de


ventas, el ao pasado introdujo un nuevo juguete de bajo precio y desea estimar las
ventas de este nuevo juguete en el prximo ao en trminos de gastos de publicidad.
Ventas (miles) : 120 180 135 147 185
Gastos de Publicidad.($) : 50 60 65 72 84
a) Se tom la decisin altamente significativa de hallar un modelo lineal. Fue
correcta la decisin?
b) Encontrar dicho modelo de regresin lineal.
c) Si el gasto de publicidad es $70, cunto se espera que sea como mximo el
promedio de ventas?
d) Por cada dlar que se incremente en publicidad, cunto se espera que sea
como mximo el cambio que se produce en las ventas?

40.- El director ejecutivo de una asociacin de ejecutivos nacionales de ventas sabe la


relacin que existe entre los resultados de un vendedor en las pruebas de aptitud, el
nmero de aos de experiencia en este campo y las ventas anuales de la persona. La
informacin siguiente fue recogida para seis vendedores escogidos al azar.
Y : Ventas anuales ( $ 10 000) X1 : Resultado de aptitud
X2 : Aos de experiencia.
Y : 36 28 39 30 45 22
X1 : 84 74 89 78 92 70
X2 : 7 5 8 7 10 3
a) Hallar la ecuacin del plano de regresin.
b) Si un vendedor obtuvo 83 en la prueba de aptitud y tiene 7 aos de
experiencia, cules sern las ventas que podrn esperarse de esta persona?
c) Qu tan lejos est el plano de regresin con respecto a los valores
observados?

41.- Se tienen los siguientes datos correspondientes a:


FV : Fluidez Verbal (nmero de palabras / 3 m)
CI : Cociente Intelectual.
I : Ingresos de los padres (miles de pesetas/mes)

FV : 37 13 35 10 17 33 15 22 20 28 20
CI : 135 92 135 97 103 118 104 124 110 115 113
I : 125 50 115 55 60 100 65 100 70 95 80

a) Hallar la ecuacin de regresin para la prediccin de la Fluidez verbal a partir


de las otras dos variables.
b) Los pronsticos que se realicen usando esta ecuacin, sern acertados?
c) Qu porcentaje de los cambios producidos en la variable predictando se
puede atribuir a las variaciones en las variables predictoras?

42.- Una muestra muestra aleatoria de cinco familias da la siguiente informacin en


relacin al ingreso familiar anual y los gastos anuales en bienes durables
(refrigeradoras, lavadoras, televisores, etc.)
Ingreso Anual (miles de soles) : 5 8 7 10 15
Gastos (cientos de soles) : 7 14 8 15 20
a) Se puede atribuir la variacin en los gastos anuales a las variaciones en el
ingreso anual?
b) Podemos afirmar que ambas variables estn asociadas linealmente?

Gladys Enrquez Mantilla 256


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

43.- Una compaa distribuye un test de aptitud entre todos sus nuevos representantes
de ventas. La direccin tiene inters en conocer la capacidad del test para predecir el
eventual xito de estos representantes. Los datos adjuntos recogen el valor (en miles
de soles) de las ventas semanales medias y las puntuaciones obtenidas en el test de
aptitud para una muestra aleatoria de ocho representantes.
Ventas semanales : 10 12 28 24 18 16 15 12
Puntuacin Test : 55 60 85 75 80 85 65 60
a) Se puede afirmar que un modelo lineal es un buen ajuste? Por qu?
b) Podemos afirmar que a mayor puntuacin obtenida en el test, se espera que
sus ventas semanales sean mayores? Por qu?
c) Si un representante obtuvo 72 puntos en el test, cul ser su venta semanal
esperada?
d) Para una puntuacin de 78 en el test, cunto se espera que sea la venta
semanal promedio?

44.- Un estadstico de una fbrica de automviles quiere desarrollar un modelo


estadstico para predecir el tiempo de entrega (el nmero de das entre la fecha del
pedido y la fecha de entrega del automvil) de automviles nuevos ordenados con
mucho equipo opcional y la distancia de traslado (en cientos de millas). El estadstico
selecciona una muestra aleatoria de 7 automviles con los resultados siguientes:
Opciones ordenadas : 3 4 4 7 7 8 9
Distanc. Traslado : 7.5 13.3 4.7 14.6 8.4 12.6 6.2
Tiempo de entrega : 25 32 26 38 34 41 39

a) Hallar el plano de regresin. Y =13.6 + 2.34 X1 + 0.621 X 2

b) Cunto de los cambios de Y se pueden atribuir a la variacin conjunta de X1


y X2 ? 0.982

c) Qu tanto se alejan los valores observados con respecto al plano de


regresin? 1.0233

d) Cmo es la correlacin entre la variable predictando y la mejor predictora


para valores constantes de la otra predictora? Por qu? 0.988

e) Usando un modelo lineal con la mejor predictora y con un margen de error


del 1%, qu valor se espera obtener en la variable respuesta partiendo de un
valor de 15 en la variable predictora? 34.84 ; 77.30

f) Se puede afirmar que los cambios que se producen en la variable respuesta


se deben a los cambios de la variable predictora? S 26.52

45.- Estamos interesados en investigar cmo vara el peso (libras) con la altura (pulgadas)
y edad (aos) en los nios con una cierta deficiencia nutricional. Para tal efecto se
obtiene una muestra aleatoria de nios, obtenindose los siguientes resultados:
Peso 64 71 53 67 55 58 77 57 56 51 76 68
Altura 57 59 49 62 51 50 55 48 42 42 61 57
Edad 8 10 6 11 8 7 10 9 10 6 12 9
a) Podemos afirmar que ambas variables son buenas predictoras? Por qu?
b) Qu tanto de los cambios de la variable predictando se ven explicados por
un modelo de regresin lineal?
c) En qu medida se alejan los valores observados con respecto al modelo de
regresin?
d) Realizar e interpretar un pronstico, al nivel del 1%.

Gladys Enrquez Mantilla 257


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

46.- Una tienda especialista en trajes para personas de negocios con xito intenta
determinar las variables que pueden explicar el nivel de compras de sus clientes. Se
recogieron datos de las compras por cada visita en dlares, los ingresos de los
clientes en miles y los aos de permanencia del cliente en su empleo. Se pensaba
que la ltima variable mide hasta dnde ha subido el cliente en la escala de puestos
de la empresa y, por tanto, refleja su necesidad de vestir con elegancia.

Compras : 630 550 320 820 450 755 750 330 950 655
Ingresos : 107 95 54 141 76 130 127 55 174 110
Aos Perm. : 12 12 6 16 10 15 14 9 22 13
Despus de recoger los datos, el director de la tienda se confiesa nulo en estadstica
y no tiene ni idea de qu hacer con ellos, puede ayudarle?
a) Hallar el plano de regresin.
b) Si el director tiene la oportunidad de servir a un cliente con un ao ms de
experiencia o a uno con 1000 ms de ingreso, a quin debe atender?
c) Permiten los datos determinar qu variable es la ms importante para
explicar las compras? Por qu?

47.- Los siguientes datos corresponden a las calificaciones y las puntuaciones en


ansiedad obtenidas por un grupo de estudiantes:

Ansiedad : 8 10 12 16 14 18 22 23 19 26 28 27
Calificac. : 12 10 9 9 8 7 5 6 8 5 3 4

a) Sera apropiado utilizar un modelo lineal para realizar pronsticos?


b) Qu porcentaje de la variable predictando explica el modelo de regresin?
c) Calcular el error estndar de estimacin.
d) Con un margen de error del 5%, qu calificacin cabe esperar partiendo de
una ansiedad de 20 puntos? 4.868 , 8.394
e) Hallar un intervalo de confianza del 95% para la cantidad por la cual un
estudiante de la poblacin de la que se efectu el muestreo puede esperar
cambiar su calificacin aumentando un punto en su ansiedad.
f) Con una confianza del 90%, se puede afirmar que los cambios que se
producen en la variable predictando se pueden atribuir a los cambios de la
variable predictora?
g) Se puede afirmar que existe una buena asociacin lineal entre X e Y?
h) Si la ansiedad toma el valor 25, cunto se espera que sea la calificacin
promedio?

48.- Durante los ltimos cuatro aos, los gastos en publicidad y las ventas de una
empresa (en millones de pesetas) han sido:

Ventas : 100 126 180 210


Gastos : 1.0 1.3 1.7 2.0
a) Ser un modelo lineal un buen ajuste? Por qu?
b) Si en el quinto ao la empresa ha previsto tener un gasto de 2.17 millones de
pesetas, y suponiendo que las condiciones de mercado no se alteran, qu
ventas obtendr dicha empresa?
c) Con qu fiabilidad debe esperarse el resultado anterior?
d) Qu porcentaje de las variaciones en las ventas no se debe a los gastos en
publicidad?
e) Se podra afirmar que los cambios que se producen en las ventas no se
deben a efectos aleatorios?
f) Entre qu valores se espera que est variando el coeficiente de regresin?
g) Si el gasto es de 2.15 millones, qu podemos afirmar acerca de las ventas
promedio? Usar un nivel del 10%.

Gladys Enrquez Mantilla 258


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

49.- Se sospecha que la tasa de fallos de cierto componente electrnico est relacionada
con la temperatura. Se obtiene la siguiente muestra de la variable bidimensional:
(Temperatura grados Fahrenheit , Fallos en una hora x 106) = (X , Y)

55;1.90 65;1.93 75;1.97 85;2.00 95;2.01 105;2.01


a) Trazar la nube de puntos de la muestra.
b) Hallar la recta de regresin de la tasa de fallos sobre la temperatura.
c) Calcular e interpretar el coeficiente de correlacin lineal de Pearson.
d) Qu nmero de fallos puedes predecir que se producirn en una hora a 70
Fahrenheit? Obtener una conclusin altamente significativa.
e) Qu tan alejados estn los puntos del diagrama de esparcimiento con
respecto al modelo lineal de regresin?

50.- Una empresa que fabrica circuitos electrnicos aplica un riguroso control de calidad.
La produccin se lanza por lote de 100 circuitos y luego se prueba cada circuito. Los
circuitos defectuosos (por lote) son inmediatamente reparados por el servicio de
reparacin. Para poder planear adecuadamente la rotacin del personal obrero en el
servicio de reparacin, es importante poder predecir el tiempo (en minutos) requerido
en este servicio despus de la produccin de un lote. La empresa dispone de los
datos siguientes:

N defectuosos 1 2 3 4 4 5 6 6 7 8
Tiempo reparac. 23 29 49 64 74 87 96 97 109 119
a) Sera apropiado utilizar un modelo lineal para realizar pronsticos? Por qu?
b) Qu porcentaje de la variable predictando es explicado por un modelo de
regresin lineal?
c) Calcular e interpretar el error estndar de estimacin. 5.12
d) Con un margen de error del 5%, qu tiempo se utilizar en la reparacin cuando
se tienen 10 artculos defectuosos? 143.94 ; 164
e) Hallar un intervalo de confianza del 95% para la verdadera variacin que se
produce en el tiempo de reparacin por cada artculo defectuoso que se
incremente. 12.90 ; 16.46
f) Con una confianza del 90%, se puede afirmar que los cambios que se producen
en la variable predictando se pueden atribuir a los cambios de la variable
predictora? Por qu?

51.- Una empresa de desarrollo de software establece relacionar sus ventas en funcin
del nmero de pedidos de los tipos de software que desarrolla (Sistemas Educativos y
Automatizaciones Empresariales), para atender 10 proyectos en el presente ao. En
la siguiente tabla se muestra las ventas (en miles de soles), el nmero de pedidos de
sistemas, el nmero de pedidos de Aplicaciones Educativas y el nmero de pedidos
de Automatizaciones empresariales.
Ventas : 440 455 470 510 506 480 460 500 490
N Pedid. Sistemas : 50 40 35 45 51 55 53 48 38
N pedid. Aplic.Educat. : 105 140 110 130 125 115 100 103 118
N pedid. Automat.Empres. : 75 68 70 64 67 72 70 73 69
a) Hallar el plano de regresin. Interpretar: b1 y b 2
b) Qu tanto explica el plano de regresin hallado la relacin entre las variables
involucradas?
c) Realizar e interpretar un pronstico.
d) Hallar un modelo lineal usando la mejor predictora.
e) Influye linealmente la mejor predictora en la variable predictando?
f) Realiza un pronstico altamente significativo para las ventas promedio.
g) Realiza un pronstico significativo para las ventas.

Gladys Enrquez Mantilla 259


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

52.- Una empresa informtica tiene un registro de productos de software al cual se les
midi el nmero de errores encontrados (en cientos de mdulos) y el nmero de
lneas de cdigo que posee (miles de lneas). Los datos se encuentran resumidos en la
tabla siguiente:
N lneas de cdigo : 10 15 15 20 20 25 25 35 35
N errores encontrados : 1 1 2 2 3 3 4 4 5
N de productos : 10 7 6 5 4 3 1 1 2
a) Si se usa un modelo lineal, seran acertados los pronsticos? Por qu?
b) Hallar el modelo lineal. Interpretar a y b.
c) En promedio, qu tanto se alejan los valores verdaderos con respecto a los
valores estimados?
d) Se puede afirmar que las variaciones en el nmero de errores encontrados
son independientes del nmero de lneas de cdigo?
e) Si el producto tiene 37000 lneas de cdigo, cuntos errores se espera
encontrar? Usar un nivel del 10%.
f) Entre qu valores se espera que est variando el verdadero coeficiente de
regresin?
g) Usando el modelo lineal hallado, calcular los errores de estimacin.

53.- En una empresa de servicio de Internet busca relacionar las ganancias que obtiene
cada computadora con el nmero de usuarios que ingresan a dicha cabina
diariamente. En la tabla representa las ganancias S/. y el nmero de usuarios.

Ganancia : 100 98 99 102 102 111 97 104 102 96


N de usuarios : 116 96 110 105 99 106 100 109 98 108

a) Hallar un modelo que le permita realizar buenos pronsticos.


b) Con una confianza del 99%, realizar e interpretar un pronstico.
c) Cunto se espera que sea la ganancia promedio, si el nmero de usuarios
que ingresan a la cabina es 94?
d) Los cambios que se producen en la ganancia, se pueden atribuir a la
cantidad de usuarios que ingresan en la cabina?
e) Cunto se espera que cambie la ganancia, si el nmero de usuarios se
incrementa en uno?

54.- Los datos de la tabla adjunta muestran el tiempo en horas de impresin de trabajos
que se han impreso en una impresora lser de marca HP. Se est interesado en
estudiar la relacin existente entre la variable de inters tiempo de impresin de un
trabajo y la variable explicativa nmero de pginas del trabajo. Hacer el estudio en
base a los datos obtenidos en el muestreo y que son los siguientes:

Tiempo : 1 2 3 4 5 6 7 8
N Pgs. : 0.60 0.9 1.40 1.80 2.50 3.2 3.4 4.5

a) Hallar la recta de regresin considerando el tiempo como variable predictora.


b) Hallar una recta usando el nmero de pginas como variable explicativa.
c) Realizar una estimacin altamente confiable del nmero de pginas que se
imprimiran en 12 horas.
d) Al nivel del 1%, estimar el tiempo de impresin mximo si el nmero de
pginas es 850.
e) Qu se puede afirmar acerca del verdadero coeficiente de regresin?
f) Se puede afirmar que las variaciones en el tiempo de impresin son
independientes del nmero de pginas?
g) Qu porcentaje de la incertidumbre original se ha explicado mediante el
modelo lineal?
h) Podemos afirmar que hay una asociacin lineal entre ambas variables?

Gladys Enrquez Mantilla 260


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

55.- El Gerente de Ventas de una compaa desea hallar un modelo que le permita
realizar pronsticos confiables de sus ventas semanales, para ello cuenta con la
siguiente informacin correspondiente a doce vendedores.
Ventas semanales Puntuacin Calificacin
CI
(en miles de soles) de la prueba de desempeo
5 4 2 90
12 7 5 105
4 3 1 88
8 6 4 95
11 10 6 110
4 9 5 98
30 2 10 120
14 5 5 115
6 9 4 92
14 2 6 110
4 1 1 95
5 3 1 90

a) Hallar el plano de regresin e interpretar b1 , b2 , b3


b) Qu tan lejos estn los puntos del dispersigrama con respecto al plano de
regresin?
c) Si usamos la mejor variable predictora, sera til un modelo lineal? Por
qu?
d) Se puede afirmar que los cambios que se producen en la variable
predictando se deben a fluctuaciones aleatorias que son independientes de
los cambios de la mejor variable predictora?
e) Qu se puede afirmar acerca del verdadero coeficiente de regresin? Si se
usa un nivel del 10%.
f) Qu tipo de relacin existe entre las ventas y las puntuaciones de la
prueba? Por qu?

56.- Un socilogo asignado a una institucin correccional estuvo interesado en estudiar la


relacin entre inteligencia y delincuencia. Un ndice de delincuencia (variando de 0 a
50) fue formulado para medir la gravedad y frecuencia de crmenes cometidos,
mientras la inteligencia fue medida por IQ. La tabla muestra el ndice de
delincuencia (ID) y el IQ para una muestra aleatoria de convictos menores.

ID : 26.2 33.0 28.5 25.25 20.3 31.9 21.1 22.7 22.1


IQ : 110 89 102 98 110 98 122 119 120

35.5 38 30
85 73 90

a) Un modelo lineal, permitir realizar pronsticos cercanos a la realidad? Por


qu?
b) Influye el IQ en el ndice de delincuencia?
c) Con una confianza del 90%, cunto se espera que sea como mximo el
verdadero coeficiente de regresin?
d) Si el cociente de inteligencia es 115, cunto se espera que sea el ndice de
delincuencia promedio? Obtener una conclusin al nivel del 10%.
e) Se puede concluir que ambas variables estn relacionadas linealmente?
f) Cunto se espera que sea el ndice de delincuencia, si el cociente de
inteligencia es 108?
g) Qu tan alejados estn los valores observados con respecto a los valores
reales?

Gladys Enrquez Mantilla 261


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

57.- El ingreso anual (en miles de soles) disponible y los gastos de consumo de 9 familias,
seleccionadas aleatoriamente, en una zona de cierta ciudad han sido en miles de
dlares los siguientes:
Gasto : 7 12 18 30 20 24 8 11 8
Ingreso : 8 15 20 35 28 25 8 13 7
a) Se puede concluir que los cambios de la variable predictando se deben a
efectos aleatorios?
b) Hallar el alejamiento de los puntos del diagrama de dispersin con respecto al
modelo hallado.
c) Calcular los errores de estimacin.
d) Si el ingreso anual es 32000, cunto esperamos que sea como mximo el
gasto promedio? Obtener una conclusin altamente significativa.
e) Cunto se espera que sea como mnimo el gasto de consumo, si se sabe que
el ingreso anual es 18000?

58.- Un gerente de recursos humanos desea determinar el salario que debe pagar a cierta
categora de obreros. Para determinar dicho salario se realiza un estudio en el que
intervienen las variables Salario Mensual ($), Nivel de Produccin Anual en la
Empresa (en miles de dlares) y Nivel de Especializacin media del trabajador (de 0 a
10). El gerente obtiene los siguientes resultados:
Salario ($) : 123.4 135.7 115.9 100.6 98.7 150.4 124.6 110.0
Produccin : 300.5 325.9 298.6 200.9 300.4 359.8 279.6 215.6
Especializacin : 4.3 5.5 7.8 4.9 4.3 8.5 6.4 5.6
a) Calcular el plano de regresin lineal mnimo cuadrtico que explica el salario
en funcin de la produccin y del nivel de especializacin.
b) Qu salario se debera pagar si el nivel de produccin fuese de 315 mil
dlares y el nivel medio de especializacin de 6.6?
c) Calcular los valores estimados usando el plano de regresin.
d) Hallar los residuos.
e) Qu tanto se alejan los puntos del dispersigrama con respecto al plano de
regresin?

59.- Una empresa de ventas por Internet de productos informticos est interesada en
estudiar qu variables influyen en sus costes mensuales. Para ello recogieron los
costes de distribucin (en miles de dlares), las ventas (en cientos de miles de
dlares) y el nmero de rdenes de compras (en miles) de los ltimos 9 meses).
Costes : 5.30 7.17 8.56 6.37 7.28 6.84 5.25 7.08 8.20
Ventas : 3.86 4.46 5.12 4.01 4.57 4.58 3.01 4.84 5.17
a) Hay una asociacin lineal entre ellas?
b) Influyen las ventas en los costes mensuales? Usar un nivel del 1%.
c) Cunto ser como mximo el cambio que se produce en los costes cuando
las ventas se incrementen en cien mil dlares?
d) Si las ventas toman el valor 4.35, cunto se espera que sea el coste promedio
mensual? Usar un nivel del 10%

60.- Se realiza un estudio de mercado de un nuevo producto, de acuerdo a las encuestas


realizadas se obtienen los siguientes datos sobre la demanda segn el precio de
venta.
Demanda : 110 115 120 125 129 135 136 139 141 147 160
Precio : 50 52 54 56 58 60 62 64 66 68 70
a) Se puede afirmar que los cambios que se producen en el precio son
explicados por las variaciones en la demanda de dicho producto?
b) Existe una relacin lineal entre precio y demanda?

Gladys Enrquez Mantilla 262


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

61.- Se lleva a cabo un control de gastos de mantenimiento para cada una de las cajas
registradoras de una cadena de tiendas de comestibles. Se tienen los datos
correspondientes a la antigedad (aos) y el gasto de mantenimiento (dlares).
Antigedad : 6 7 1 3 6 4 5 2 1 9 3
Gasto : 142 231 78 90 125 145 162 99 114 165 150
a) Hallar la ecuacin de un modelo lineal de regresin. Interpretar a y b.
b) Una caja registradora tiene 8 aos de antigedad, cul ser el gasto
promedio de mantenimiento?
c) Qu tanto de los cambios en el gasto de mantenimiento, lo podemos atribuir
a las variaciones en la antigedad de la caja registradora?

62.- Una agencia de viajes desea saber la relacin que hay entre las ventas (en miles), el
presupuesto destinado a publicidad y las comisiones de los vendedores; para esto
presenta los siguientes datos:
Gastos de Comisiones de
Ao Ventas
Publicidad Vendedores
2005 264 550 15840
2006 384 590 19250
2007 415 680 26013
2008 425 700 16896
2009 543 750 16290
a) Cul de las dos variables predictoras es la mejor?
b) Hallar la ecuacin del plano de regresin.
c) Qu tanto se alejan los puntos del diagrama de dispersin con respecto al
plano de regresin hallado?

63.- En un grupo de ocho pacientes se miden las cantidades antropomtricas peso y


edad, obtenindose los siguientes resultados:
Edad : 12 8 10 11 7 7 10 14
Peso : 58 42 51 54 40 39 49 56
a) Existe una relacin lineal importante entre ambas variables?
b) Hallar la recta de regresin del peso en funcin de la edad.
c) En qu medida, por trmino medio, vara el peso cada ao?

64.- Hay una hiptesis que sugiere que el consumo de un producto dado, expresado en
unidades compradas por persona en un ao est influido por: el ingreso por persona
que trabaja y el tamao de habitantes de una ciudad. Se cuenta con los siguientes
datos:
Millones de Ingreso per cpita, en Consumo del producto,
habitantes por ciudad cientos $ por habitante unidades al ao
0.6 30 11
1.4 34 16
1.3 17 9
0.3 26 9
6.9 29 8
0.3 18 7
4.2 32 11
0.6 32 8

a) Hacer un estudio de regresin o correlacin para responder a la suposicin.


b) Hallar la ecuacin del plano de regresin.
c) En cunto se alejan los valores verdaderos con respecto a los valores
estimados?
d) Qu tanto de los cambios de la variable predictando no se pueden atribuir a
la influencia de las dos variables predictoras en forma conjunta?

Gladys Enrquez Mantilla 263


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

65.- Se piensa que si aumentan el porcentaje de comisin pagada al vendedor de


automviles, aumenta la venta. Para corroborarlo, se realiz un estudio sobre un
grupo de concesionarios similares; obtenindose los siguientes resultados con
respecto a las comisiones pagadas a vendedores de autos en un mes (%) y las
ganancias netas por venta, en el mismo mes (miles de dlares).
Comisin : 3.6 5.2 5.3 7.3 5.0 5.2 3.0 3.1 3.2 7.5 8.3
Ganancia : 11.2 14.7 18.4 20.1 12.4 15.3 9.5 11.6 8.5 27.9 24.6
a) Se puede concluir que existe una relacin lineal entre ambas variables?
b) Los cambios producidos en las ganancias, se pueden atribuir a las
variaciones en el porcentaje de comisin pagada al vendedor?
c) Si la comisin es 6.5, cunto se espera que sea la ganancia promedio? Usar
un nivel del 10%.

66.- Un psiclogo clnico est probando una tcnica aversiva para reducir el hbito de
fumar que consiste en dejar el cenicero sin limpiar durante todo el da. Acude un
sujeto a su consulta y le aplica esta tcnica. El psiclogo evala el nmero de
cigarrillos fumados al da antes del tratamiento y durante varios das, obteniendo los
siguientes resultados:
Das : 0 2 4 6 7
N cigarrillos : 25 15 14 9 4
a) Ser apropiado ajustar un modelo lineal? Por qu?
b) Los cambios producidos en la variable predictando, se pueden atribuir a los
cambios de la variable predictora?
c) Con una confianza del 90%, qu podemos afirmar acerca del coeficiente de
regresin lineal?

67.- Las materias primas empleadas en la produccin de una fibra sinttica son
almacenadas en un lugar en donde no se tiene control de la humedad. La siguiente
tabla refleja en porcentajes la humedad relativa del almacn y la humedad observada
en las materias primas, durante un estudio que se llev a cabo:
Hum.relativa : 41 53 59 65 71 78 50 65 74
Hum.observada : 1.6 13.6 19.6 25.6 31.6 33.2 14.7 21.2 28.3
a) Analizar los datos utilizando un modelo de regresin lineal.
b) Construir un intervalo de confianza para la media de la humedad de las
materias primas si la humedad relativa del almacn es igual a 69.
c) Cunto valdra la humead en las materias primas si se consigue una
humedad relativa de 35? Obtener una conclusin altamente significativa.
d) Se puede concluir que ambas variables estn relacionadas linealmente?

68.- Una empresa de reparacin de cierto tipo de componentes electrnicos pretende


estudiar la relacin entre el nmero de unidades defectuosas y el tiempo de
reparacin (en minutos).

Unid.Defect. : 1 2 3 4 4 5 6 6 7 7
Tiempo : 23 29 49 64 74 87 96 97 109 109
a) Se puede concluir que los cambios que se producen en el tiempo de
reparacin se deben a efectos aleatorios?
b) Qu se puede afirmar acerca del verdadero cambio que se produce en la
variable predictando cuando las unidades defectuosas se incrementan en
una.
c) Para ocho unidades defectuosas, cunto se espera que sea el tiempo de
reparacin?
d) Se puede concluir que ambas variables estn asociadas linealmente?
e) Calcular los errores de estimacin.

Gladys Enrquez Mantilla 264


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

69.- Se desea analizar el nmero de errores cometidos por una persona en relacin con
las horas que lleva desarrollando un trabajo.
N errores : 1 2 4 4 6 6 7 8 6 5
Horas Trabaj. : 10 10 8 6 6 3 4 2 5 8
a) Hallar un modelo cuadrtico.
b) Sern acertados los pronsticos que realicemos con este modelo? Por qu?
c) Qu tanto de los cambios en el nmero de errores queda explicado por un
modelo de regresin cuadrtico?
d) En cuanto se alejan los valores observados con respecto a los valores
estimados?

70.- Se sugiere que el gasto en alimentacin por familia, expresado en cientos de dlares
por mes, est influenciado directamente por el ingreso familiar mensual en cientos
de dlares.
Ingreso : 30 34 17 26 29 18 32 32
Gasto : 21 26 5 19 18 7 23 25
a) Es correcto lo que se afirma?
b) Se puede hablar de una asociacin lineal entre gasto en alimentacin e
ingreso familiar?
c) Cunto se espera que sea el gasto promedio, si se sabe que el ingreso
familiar es 24 cientos de dlares?

71.- En base a una muestra de doce datos se quiere ajustar un modelo de regresin de la
variable respuesta, precio en euros por el que se adquiri una impresora lser,
respecto a las variables regresoras: nmero de pginas por minuto que es capaza de
imprimir y aos de antigedad de la impresora. Los datos del estudio son los
siguientes:
Precio : 466 418 434 487 516 462 475 501 594 553 551 589
N pgs. : 6 6 6 6 8 8 8 8 12 12 12 12
Antig. : 6 4 2 0 6 4 2 0 6 4 2 0

a) Hallar el modelo de regresin.


b) Qu tanto de los cambios de Y pueden ser explicados por el modelo de
regresin hallado?
c) Realiza e interpreta un pronstico.

72.- Una empresa fabricante de cereales para el desayuno desea conocer la ecuacin que
permita predecir las ventas (en miles de euros) en funcin de los gastos en
publicidad infantil en televisin (en miles de euros), el tiempo diario de aparicin en
televisin (en minutos) y los gastos en publicidad en los peridicos (en miles de
euros). Se realiza un estudio en el que se renen los datos mensuales
correspondientes a los ltimos 20 meses. Estos datos aparecen en la siguiente tabla:
Ventas : 10 12 1113 12 14 16 12 14 11 10 19 8
Public. TV : 1.0 1.2 1.3 1.4 1.5 1.7 1.8 1.3 1.4 0.9 0.8 0.9
Tiempo TV : 50 57 56 55 60 65 69 67 68 67 97 66
Public.Per. : 0.4 0.4 0.5 0.5 0.4 0.4 0.6 0.5 1.1 0.3 0.5 0.6
a) Hallar el plano de regresin usando las dos mejores predictoras.
b) Hallar los valores estimados.
c) Calcular los errores de estimacin.
d) Usando un modelo lineal con la mejor predictora, realiza un pronstico para
las ventas promedio.
e) Se puede concluir que existe una asociacin lineal entre las ventas y la
mejor predictora?
f) Cunto se espera que sea como mximo el coeficiente de regresin lineal?

Gladys Enrquez Mantilla 265


UNIF Administracin de Negocios Internacionales
Estadstica Aplicada a los Negocios

73.- Un grupo de estudiantes de pedagoga tomaron parte en un programa de evaluacin


diseado para medir la eficacia de los profesores y determinar que factores son
importantes. Participaron 11 instructores. La medicin de la respuesta fue una
evaluacin cuantitativa del maestro colaborador. Las variables regresoras fueron las
calificaciones de cuatro pruebas estandarizadas entregadas a cada instructor. Los
datos son los siguientes.

Eficacia P1 P2 P3 P4
410 69 68 59 55
569 57 54 31 63
425 77 72 80 45
300 81 65 38 50
324 70 60 49 41
280 53 82 49 43
280 77 74 60 41
450 76 66 47 64
380 65 54 50 46
584 97 62 62 68
434 76 70 54 57
a) Cul de las tres pruebas es la mejor predictora? Por qu?
b) Hallar el modelo de regresin usando las dos mejores predictoras.
c) El plano de regresin hallado, permitir realizar pronsticos confiables? Por
qu?
d) Utilizando la mejor predictora, hallar la ecuacin de regresin.
e) Se puede afirmar que la mejor predictora influye en la eficacia?
f) Qu tan lejos se encuentran los puntos del diagrama de dispersin con
respecto a la recta de regresin?
g) Cunto se espera que sea como mnimo el verdadero coeficiente de
regresin? Obtener una conclusin altamente significativa.
h) Si la puntuacin en la prueba es 70, cunto se espera que sea como mnimo
la puntuacin en eficacia?
i) Se afirma que existe una relacin directa entre la eficacia y la calificacin
obtenida en la prueba 3, es correcta dicha afirmacin? Por qu?

74.- El ingreso anual disponible y los gastos de consumo de 9 familias, seleccionadas


aleatoriamente, en una zona de cierta ciudad han sido en miles de dlares los
siguientes:
Gasto : 7 12 18 30 20 24 8 11 8
Ingreso : 8 15 20 35 28 25 8 13 7
Haciendo uso de esta informacin, responder a las siguientes preguntas:
a) Ajuste por mnimos cuadrados una recta en la que el consumo sea funcin de los
ingresos.
b) Los pronsticos que se realicen con el modelo lineal hallado, sern cercanos a la
realidad? Por qu?
c) Comente el significado del coeficiente de la recta ajustada.
d) Cunto de los cambios en la variable predictando, no se pueden atribuir a los
cambios de la variable predictora?
e) Se puede concluir que los cambios de la variable predictando se deben a efectos
aleatorios?
f) Hallar el alejamiento de los puntos del diagrama de dispersin con respecto al
modelo hallado.
g) Calcular los errores de estimacin del modelo lineal.
h) Qu se puede afirmar acerca del verdadero coeficiente de regresin?

Gladys Enrquez Mantilla 266

S-ar putea să vă placă și