Documente Academic
Documente Profesional
Documente Cultură
Regresin
Es un mtodo que se emplea para encontrar una funcin que se adapte o ajuste a un
diagrama de esparcimiento con la finalidad de poder obtener una prediccin aproximada de
una de las variables a partir de la otra.
Modelos de Regresin:
Para hallar los valores de a y b debern resolverse las dos ecuaciones siguientes, llamadas
ecuaciones Normales:
na + b X = Y
a X + b X2 = XY
Al resolver estas ecuaciones usando la regla de Cramer se obtiene:
a =
X2 Y X XY b =
n XY X Y
n X2 ( X ) n X 2 ( X )
2 2
Error o residuo: e i
SUPUESTOS:
Para que sea vlido un modelo de regresin lineal, es necesario que se cumplan los
siguientes supuestos: linealidad, homogeneidad, homocedasticidad, independencia y
normalidad.
Estos supuestos son de suma importancia, pues permitirn al analista determinar de
manera tcnica, si la relacin entre las variables puede ser explicada de manera consistente,
o si existen aspectos que podran indicar que el modelo no es una buena herramienta de
prediccin, o ajuste.
Linealidad
Si pretendemos ajustar una lnea recta a un conjunto de datos es fundamental que stos
tengan un aspecto compatible con el de una recta. Eso significa que los datos deben ser
razonablemente rectos, es decir la recta de regresin debe representar bien la estructura de
los datos.
Homocedasticidad
Var ( e i ) = 2 , i : 1, 2 , .... , n
Esto significa que la nube de puntos de los datos tiene una anchura semejante a lo largo de
la recta de regresin. Si lo datos tienen una variabilidad constante se dice que son
Homocedsticos. Por el contrario, datos cuya variabilidad no es constante se denominan
Heterocedsticos.
Grficamente, significa que la nube de puntos de los datos tiene una anchura ms o menos
constante a lo largo de la recta de regresin.
Homogeneidad
E ( e i ) = 0 , i : 1, 2 , .... , n
Esto significa que el ajuste que se va a realizar est centrado respecto de los datos, por lo
tanto cabe esperar que la recta de regresin est centrada en la nube de puntos de los
datos.
Independencia
Los errores o residuos e i son variables aleatorias independientes. Significa que una
observacin (un punto) no debe dar informacin sobre las dems.
El supuesto de independencia de los errores e i , se puede chequear grficamente por medio
de un diagrama de dispersin entre los residuales (eje Y) y el orden en que se tomaron las
observaciones (si se tiene, en el eje X).
Normalidad
Una vez ajustado el modelo es necesario comprobar que se cumplen las hiptesis que hemos
realizado. Ser necesario comprobar la linealidad de los datos, la homocedasticidad, y la
normalidad. La comprobacin de las propiedades anteriores se realiza mediante grficos.
Linealidad:
Homocedasticidad:
Al analizar los residuos, tambin hay que verificar que su varianza sea ms o menos
constante. Sern tiles los grficos de residuos frente a valores de X y de residuos frente a
valores ajustados o predichos.
Ejemplo:
Una encuesta entre vendedores de autos usados para determinar la relacin entre la
cantidad de anuncios clasificados y la venta de autos usados, dio los siguientes resultados
del nmero de avisos clasificados y el nmero de automviles usados vendidos para cada
uno de los negocios que no utilizaron ningn otro medio publicitario.
N Anuncios clasificados : 74 45 50 38 29 17
N Autos vendidos : 139 110 95 78 60 54
Clic en Aceptar.
LINEALIDAD:
Clic en Aceptar
Clic en Aceptar.
130
120
110
Interpretacin: En el diagrama
de esparcimiento se observa que
AutosVend
100
los datos tienen un aspecto
90
compatible con la lnea recta.
80
70
60
50
10 20 30 40 50 60 70 80
Anuncios
HOMOCEDASTICIDAD
NORMALIDAD
95
90
Interpretacin: Se observa
80
que los puntos tienden
Porcentaje
70
60 alinearse alrededor de la
50
40 recta por lo tanto se concluye
30
que los residuos presentan
20
una distribucin normal.
10
1
-20 -10 0 10 20
Residuo
vs. ajustes
(la respuesta es AutosVend)
15
10
Residuo
-5
-10
50 60 70 80 90 100 110 120 130 140
Valor ajustado
Correlacin
Es el mtodo empleado para determinar el grado de relacin entre las variables que se
estudian para as determinar en qu medida una relacin funcional describe o explica de
una forma adecuada la relacin entre estas variables.
La regresin por si sola no es suficiente, ya que, es verdad que busca la mejor relacin, pero
sta puede que no sea buena.
Explica el grado de la bondad del ajuste del modelo de regresin. Se utiliza para saber si la
funcin lineal es representativa de la relacin entre dos variables X e Y.
1 r + 1
r =
XY X Y
n
X ( X ) n Y ( Y )
n 2 2 2 2
En el ejemplo:
6 25608 253 536
r = = 0.958217
( 6 12575 253 2 ) ( 6 53046 536 2 )
Coeficiente de determinacin: r 2
El coeficiente de determinacin es una medida que nos informan si, en trminos globales, el
ajuste es bueno o no. Se expresa en porcentaje.
0% r 2 100%
Si r 2 tiende a 0%, la bondad del ajuste es mala puesto que la regresin tiende a explicar el
0% de las variaciones de la variable respuesta Y.
Si r 2 tiende a 100%, la bondad del ajuste es ptima, puesto que la totalidad de las
variaciones de la variable respuesta Y vienen explicadas por la regresin.
En el ejemplo:
Significa que el 91.78% de las variaciones en el nmero de autos vendidos estn explicadas
por el modelo de regresin lineal.
(1 r 2 )
n 1
2
rAdj = 1
n p 1
Donde:
n : Nmero de datos.
p : Nmero de variables predictoras.
En el ejemplo:
El error estndar de estimacin mide la variabilidad de los datos alrededor de la lnea recta
ajustada.
Si el margen de error tiende a cero, significa que cada valor de los e i tiende a tomar el valor
cero, es decir la nube de puntos est muy prxima a la recta estimada.
SL =
Y2 a Y b XY
n2
En el ejemplo:
Intervalo de confianza: IC
Un Intervalo de confianza del 95% significa que podemos estar 95% seguros de que este
intervalo incluye el valor Y (promedio de Y), para un valor determinado x 0 de la variable
predictora X.
El intervalo de confianza IC para Y es: L i Y L s y se calcula mediante:
1 n ( x 0 x )2
a + b x 0 t 0 SL +
n X2 ( X )
n 2
t 0 = t1 - /2 , n 2
En el ejemplo:
Para 55 avisos clasificados, hallar un intervalo de confianza del 95% para el nmero
promedio de autos vendidos.
Solucin:
t o = t1 - /2 , n 2 = t 0.975 , 4 = 2.776 x 0 = 55 x = 42.17
1 6 ( 55 42.17 )2
22.845555 + 1.576785 55 2.776 10.277 +
6 6 12575 253 2
95.22 Y 123.92
Con una confianza del 95%, para 55 avisos clasificados se espera que el nmero promedio
de autos vendidos sea aproximadamente como mnimo 95 y como mximo 124.
Intervalo de prediccin: PI
Un Intervalo de Prediccin del 95% significa que podemos estar 95% seguros de que este
intervalo incluye a y (valor de una nueva observacin individual), para un valor
determinado x 0 de la variable predictora X.
1 n ( x 0 x )2
a + b x 0 t0 SL 1 + +
n X2 ( X )
2
n
t 0 = t1 - /2 , n 2
En el ejemplo:
Para 55 avisos clasificados, hallar un intervalo de pronstico del 95% para el nmero de
autos vendidos.
Solucin:
t o = t1 - /2 , n 2 = t 0.975 , 4 = 2.776 x 0 = 55 x = 42.17
1 6 ( 55 42.17 )2
22.845555 + 1.576785 55 2.776 10.277 1+ +
6 6 12575 253 2
77.63 Y 141.50
Con una confianza del 95%, para 55 avisos clasificados se espera que el nmero de autos
vendidos sea aproximadamente como mnimo 78 y como mximo 142.
Clic en Opciones
Clic en Opciones
S 10,2770
150 R-cuad. 91,8%
R-cuad.(ajustado) 89,8%
AutosVend
100
50
0
10 20 30 40 50 60 70 80
Anuncios
Por lo tanto se concluye que es aceptable utilizar este modelo para predecir el nmero de
autos vendidos en funcin del nmero de anuncios clasificados.
Este intervalo est centrado en la estimacin puntual del parmetro y la cantidad que se
extiende a cada lado de la estimacin depende del nivel de confianza deseado y de la
cantidad de variabilidad del estimador.
Un intervalo de confianza del ( 1 )% para la pendiente de la verdadera recta de
regresin es: L i L s
SL
b to t o = t1 - /2 , n 2
( X)
2
2
X
n
En el ejemplo:
Solucin:
to = t1 - /2 , n2 = t0.975 , 4 = 2.776
10.277
1.576785 2.776 0.92 2.23
253 2
12575
6
Con una confianza del 95% se espera que el coeficiente de regresin est variando entre
0.92 y 2.23.
Donde:
SCR : Refleja la cantidad de variacin de los valores de Y explicados por el modelo lineal.
1. Hiptesis:
2. Valor Crtico: F1 , 1 , n 2
CMR
3. Estadstica de Prueba: F =
CME
Donde:
SCT = Y2
( Y )2
SCR = b2 X2
( X )2
n n
SCE = SCT - SCR
5. Conclusin:
Con una confianza del (1-)%, si se acepta H 0 la variable predictora X no influye y
no hay relacin lineal entre ambas variables. En caso contrario, s existe una
relacin lineal entre ambas variables.
SCE SCR
SL = = CME r2 =
n2 SCT
En el ejemplo:
Con una confianza del 95%, se puede afirmar que las variaciones en el nmero de autos
vendidos se deben a fluctuaciones aleatorias que son independientes del nmero de
anuncios clasificados?
Solucin:
1. Hiptesis:
H0 : = 0
H1 : 0
7.71
CMR
3. Estadstica de Prueba: F = = 44.90
CME
( Y)
2
5362
SCT = Y 2
n
= 53046
6
= 5163.33
SCR = b
( X)
2
= 1.57682 2532
2
X 2
n 12575
6
= 4740.96
5. Conclusin:
Con una confianza del 95% no se puede afirmar que las variaciones en el nmero de
autos vendidos se deben a fluctuaciones aleatorias independientes del nmero de
anuncios clasificados.
H0 : 0 H0 : 0 H0 : = 0
H1 : < 0 H1 : > 0 H1 : 0
t , n 2 t1 , n 2 t1/2 , n 2
Estadstica de Prueba
r n2
t =
1 r2
Hiptesis:
Hiptesis:
Hiptesis:
En el ejemplo:
Con una confianza del 95%, se puede concluir que existe una correlacin lineal entre X e
Y?
1. Hiptesis:
2. Valor Crtico:
t1 / 2 , n2 = t0.975 , 4 = 2.776
-2.776 +2.776
3. Estadstica de Prueba:
r n2 0.958217 4
t = = = 6.70
1 r2 1 0.958217 2
4. Decisin:
6.70 RR rechazar H 0 y aceptar H1
5. Conclusin:
Con una confianza del 95%, existe suficiente evidencia para concluir que hay una
asociacin lineal entre X e Y.
Clic en Aceptar.
La parbola por lo general se aplica en aquellos casos en que se presenta una parte
ascendente y en seguida una descendente o viceversa.
En la prctica su uso es poco frecuente sin embargo a veces se utiliza para proyecciones de
utilidad, ingresos.
Su grfico:
Y = a + b X + c X 2
Para hallar los valores de a, b y c se deben resolver las siguientes ecuaciones normales:
a n + b X + c X2 = Y
aX + b X2 + c X3 = X Y
a X2 + b X3 + c X 4 = X2 Y
r =
a Y + b XY + c X2 Y n Y
Y2 n Y2
SC =
Y2 a Y b XY c X2 Y
n 3
Ejemplo:
En la una fbrica se tienen los siguientes datos correspondientes a las horas trabajadas (en
miles) que producen cierto producto (en unidades).
Horas Trabajadas : 1 2 4 5 7 8 8 9 10 12
Produccin : 25 15 10 10 15 10 20 20 35 45
205 66 548
40 072 580
a = 1560 548 5022 = = 29.957
1 337 672
14750 5022 48788
10 205 548
10 578 600
b = 66 1560 5022 = = 7.908
1 337 672
548 14750 48788
10 66 205
1 043 220
c = 66 548 1560 = = 0.780
1 337 672
548 5022 14750
r 2 = 0.95 2 = 90%
Clic en Opciones
Regresin
60
IC de 95%
PI de 95%
50
S 4,09621
R-cuad. 90,4%
40 R-cuad.(ajustado) 87,6%
Produccion
30
20
10
0 2 4 6 8 10 12
HorasTrab
Al graficar los valores X e Y se obtiene una curva creciente o decreciente, es decir que la
variable predictora evoluciona en forma aritmtica y la variable predictando evoluciona en
forma geomtrica. En la prctica son numerosas las variables que presentan un crecimiento
geomtrico: la poblacin, ventas, salarios, ingresos, etc.
Su grfico:
Y = a . b X
r =
X log Y X . log Y
n
( n X2 ( X )2 ) ( n ( log y )2 ( log Y )2 )
Ejemplo:
La demanda de televisores (miles de unidades) y los gastos de publicidad (cientos de
dlares) en un pas desde 2006 hasta 2010 fue:
Gastos de Publicidad : 2 4 5 7 12
Demanda de TV : 3 6 12 24 45
a) Ajustar a los datos un modelo exponencial:
5.37 30
38.96 208 109.26
log a = = = 0.38 a = 2.38
290 290
5 5.37
30 38.96 33.7
log b = = = 0.12 b = 1.31
290 290
b) Realizar un pronstico:
Cuando los gastos de publicidad sean de 1300 dlares, se espera que la demanda de
televisores sea 80 000.
Calc Calculadora
Entonces en la columna C3
aparecern los logaritmos de la
columna C2.
Clic en Aceptar
Y = a . b X Y = 2.371374 1.306171X
Regresin Mltiple
En la regresin mltiple se trata de predecir una sola variable respuesta a partir de dos o
ms variables predictoras. Permite utilizar una mayor informacin disponible para estimar
la variable respuesta, de esta forma se trata de aumentar la precisin del estimado.
Y
= f ( X1 , X 2 , .... , X p )
Variable
dependiente Variables
independientes
Un modelo de regresin mltiple expresa una relacin lineal entre una variable dependiente
y dos o ms variables independientes ( X1 , X 2 , .... , X p ) .
Y = 0 + 1 X1 + 2 X 2 + .... + p X p + e i
Y = b0 + b1 X1 + b2 X2
El criterio de mnimos cuadrados localizar el plano que minimice la suma de los cuadrados
de los errores de estimacin, obtenindose las ecuaciones normales:
b0 n + b1 X1 + b2 X2 = Y
b0 X1 + b1 X12 + b 2 X1 X 2 = X1 Y
b0 X2 + b1 X1 X 2 + b 2 X 22 = X2 Y
Al resolver simultneamente estas ecuaciones por el mtodo de determinantes, se obtienen
los valores de b 0 , b1 y b 2 .
Linealidad
Los datos deben satisfacer una relacin lineal. Los puntos se ajustan a un plano.
Homocedasticidad
Homogeneidad
E( ei ) = 0 , i : 1, 2 , .... , n
Independencia
Los errores o residuos e i son variables aleatorias independientes. Es decir, una observacin
no debe dar informacin sobre las dems.
Normalidad
Slo comparan dos variables, sin tener en cuenta la tercera. Miden la proporcin de la
varianza de Y explicada por X1 y X 2 exclusivamente.
r01 : Correlacin simple entre Y y X1
r02 : Correlacin simple entre Y y X 2
r12 : Correlacin simple entre X1 y X2
Es una medida que representa la proporcin de la variacin total de Y que est explicada
por el plano de regresin es decir por la influencia conjunta de X1 , X 2 y por el azar.
Mide la tasa porcentual de los cambios de Y que pueden ser explicados por X1 y X2
simultneamente.
R 20 . 12 =
b0 Y + b1 X1 Y + b 2 X 2 Y n Y
2
Y2 nY
Expresa el grado de relacin existente entre tres a ms variables. Si todos los valores de las
variables, varan en forma proporcional ya sea directa o inversamente, es decir satisfacen
una ecuacin, se dice que las variables estn correlacionadas o que existe una relacin
entre ellas.
1 R 0 . 12 + 1
SM =
( Yi Yi )2
n p 1
S Y , X1 , X 2 =
Y 2
b 0 Y b1 X1 Y b 2 X 2 Y
n3
Ejemplo:
La siguiente tabla muestra las ventas de un artculo (en cientos), los gastos de publicidad
por radio y los gastos de publicidad en peridicos (en miles de soles).
Gastos de publicidad en Gastos de publicidad en Ventas
radio (miles de soles) peridico (miles de soles) (cientos)
X1 X2 Y
4 1 7
7 2 12
9 5 17
12 8 20
X1 = 32 X 2 = 16 Y = 56
4 b 0 + 32 b1 + 16 b 2 = 56
32 b 0 + 290 b1 + 159 b 2 = 505
16 b 0 + 159 b1 + 94 b 2 = 276
4 32 16
= 32 290 159 = 236
16 159 94
56 32 16
505 290 159
276 159 94 152
b0 = = = 0.644
236 236
4 56 16
32 505 159
16 276 94 392
b1 = = = 1.661
236 236
4 32 56
32 290 505
16 159 276 4
b2 = = = 0.017
236 236
b) Interpretar : b 0 , b1 y b 2
Alrededor del 98% de la variacin total de las ventas se explica por medio de la
ecuacin de regresin.
El contraste de hiptesis del modelo de regresin permite verificar si todas las variables
independientes tienen coeficientes significativos.
Hiptesis:
H 0 : 1 = 2 = 3 = .... = p
H1 : al menos uno de los i no es cero
Si se acepta H 0 significa que ninguna de las variables predictoras es relevante para explicar
los cambios de Y.
Clic en Aceptar.
Clic en Aceptar.
20
15
Y
10 7,5
5,0
X3
2,5
5,0
7,5
10,0 0,0
X2 12,5
Clic en Aceptar.
Clic en Aceptar.
En el paso inicial se incluye en el modelo a todas las variables predictoras y en cada paso se
va eliminando las variables que dan el P-Value ms grande o el valor de t en valor absoluto
menor que 2. Una variable que es eliminada del modelo ya no puede volver a entrar en un
paso subsiguiente. El proceso termina cuando todos los P-Values son menores que 0.05
cuando todos los valores de t en valor absoluto son mayores que 2.
Aplicar el mtodo Stepwise para elegir el mejor modelo teniendo en cuenta que se tienen las
siguientes variables:
Y : Medida de severidad de la enfermedad respiratoria.
X 2 : Aos de educacin.
X 3 : Nmero de personas en el edificio donde vive la persona.
X 4 : Medida de la calidad del aire (un nmero grande indica pobre calidad).
X 5 : Nivel de nutricin.
X 6 : 0 es no fuma y, 1 s fuma.
Y X2 X3 X4 X5 X6
40 7 25 22 94 0
67 7 33 61 18 1
30 6 19 30 103 0
71 15 29 50 17 1
47 11 21 43 109 0
53 10 24 54 0 1
39 8 21 28 33 0
55 14 22 35 21 1
47 10 26 22 76 0
56 9 32 43 97 1
43 8 22 48 104 0
41 8 19 27 -37 0
51 9 28 32 87 1
48 8 22 62 131 0
36 8 19 37 53 0
Clic en Methods
Paso 1 2
Constante -16,14 -12,17 valor de la constante: b1 = 12.17
X6 -2,2
Valor T -1,13
Valor P 0,288
S 1,88 1,91
R-cuad. 98,15 97,89
R-cuad.(ajustado) 97,13 97,05
Cp de Mallows 6,0 5,3
Este mismo modelo se puede hallar, eliminando la variable X 6 y considerando slo las
dems variables.
PRCTICA N 6
Regresin y Correlacin Lineal, Cuadrtica, Exponencial y Mltiple
1.- Una compaa presenta los siguientes datos con respecto a las ventas de un
producto durante siete aos.
2.- Un fabricante quiere establecer si hay una relacin parablica entre las ausencias al
trabajo. X: nmero de permisos al mes e Y: edad del trabajador. Para ello selecciona
una muestra aleatoria de 10 trabajadores, obteniendo la siguiente informacin:
Y : 28 32 46 24 28 36 42 37 51 42
X : 5 8 4 7 10 4 3 4 3 4
a) Hallar la ecuacin de regresin parablica.
b) Estimar la edad para una persona que solicita 6 permisos en el mes.
c) Es un modelo parablico, el ms adecuado? por qu?
d) Qu porcentaje de los cambios que se producen en la variable predictando se
pueden atribuir a otros factores o al azar?
e) Si se usa un modelo lineal, se puede afirmar que los cambios de la
predictando se deben a los cambios en la predictora?
3.- Se tienen los siguientes datos correspondientes a las horas de estudio y al nmero
de errores cometidos en un examen de Estadstica Aplicada por un grupo de
alumnas del IV ciclo de Negocios Internacionales de la Unif.
Horas de estudio : 5 2 9 6 7 3 4 8
N de errores : 7 14 6 7 5 8 10 4
N de alumnas : 3 1 5 3 3 1 2 4
a) Podemos afirmar que los pronsticos que realicemos con este modelo
estarn cercanos a la realidad? Por qu?
b) Podemos afirmar que las variaciones que se producen en la variable
predictando se pueden atribuir a efectos aleatorios? Por qu?
c) Qu porcentaje de las variaciones en el nmero de errores se deben a los
cambios que se producen en las horas de estudio?
d) Qu tanto se alejan los puntos del diagrama de esparcimiento con respecto a
la recta de regresin? 1.4738
e) Cuntos errores espera cometer como mximo, un alumno que dedica 12
horas al estudio? 5.331
f) Qu se puede decir acerca de la pendiente del modelo de regresin
poblacional? Obtener una conclusin altamente significativa.
-1.32 ; -0.46
4.- Una compaa recab los datos adjuntos para comparar el precio de venta de casas
nuevas con el tamao de la construccin en cientos de pies cuadrados.
Espacio construido : 20 22 18 30 23 25
Precio de venta : 116 118 91 145 105 121
a) Podemos afirmar que a mayor espacio construido mayor precio de venta?
Justifique su respuesta.
b) Hallar un intervalo altamente significativo para el coeficiente de regresin.
c) Si el espacio construido es de 32 cul es el precio de venta mnimo y
mximo que se espera?
d) Con un nivel del 10%, hallar un intervalo para el precio de venta promedio, si
el espacio construido es 35.
e) Qu tan alejados estn los valores reales con respecto a los valores
estimados?
6.- Los siguientes datos son las puntuaciones obtenidas por un grupo de alumnos en
dos tests, que se quieren utilizar como previsores de la calificacin media de los
alumnos en el rea de Lenguaje y las calificaciones medias reales obtenidas por
dichos alumnos, ms tarde, en su curso de lenguaje.
Calificac. : 8,8 5,5 8,7 6,8 6,5 8,7 8,4 9,7 5,8
Test 1 : 8,9 4,9 8,6 6,3 5,0 8,0 8,7 9,4 5,5
Test 2 : 9,2 5,6 9,0 6,7 6,2 8,5 9,0 9,9 6,0
a) Calcular e interpretar: r12 r13 r23
0,9664 0,9862 0,9920
b) Hallar el plano de regresin.
c) Se puede afirmar que un modelo de regresin mltiple explica la relacin
entre la variable predictando y las variables predictoras? Por qu?
d) Se puede decir que hay una asociacin lineal entre la variable predictando y
la mejor predictora?
e) Qu tanto se alejan los valores observados con respeto a la recta de
regresin?
7.- Se tienen las estaturas (pulgadas) de un grupo de padres y sus hijos mayores.
Padres : 65 63 64 68 62
Hijos : 68 66 68 69 66
a) Podemos afirmar que existe una relacin inversa entre la estatura de los
padres y sus hijos? Por qu?
b) Hallar los valores mnimo y mximo para el verdadero cambio de la variable
predictando cuando la variable predictora aumenta una unidad.
c) Cul ser la estatura promedio de los hijos, si se sabe que la estatura de los
padres es 70 pulgadas?
8.- Se ajust el siguiente modelo de regresin con una muestra de 30 familias para
explicar el consumo familiar de leche.
Yi = + 1 X1 + 2 X 2 + e i
donde:
Yi : consumo de leche en litros por semana.
X1 : ingreso semanal, en cientos de dlares.
X2 : tamao de familia.
10.- Para los siguientes datos correspondientes a las ventas de un producto durante el
periodo 2003-2009:
Aos : 2003 2004 2005 2006 2007 2008 2009
Ventas : 545 755 919 1200 1600 2500 4200
Y : 29 24 27 25 26 28 30 28 28 27
X1 : 45 42 44 45 43 46 44 45 44 43
X2 : 16 14 15 13 13 14 16 16 15 15
a) Se puede combinar esta informacin con los datos de horas de trabajo
directas y obtener una ecuacin de estimacin ms precisa para los gastos
generales de la fbrica?
b) Si quisieras hallar un modelo lineal, cul variable descartaras? Por qu?
c) Se podra afirmar que los cambios que se producen en la variable
predictando se pueden atribuir a los cambios de la mejor variable predictora?
d) En cunto se alejan los puntos del dispersigrama con respecto a la recta de
regresin?
e) Al hallar un modelo lineal, se puede decir que la relacin es directa? Por
qu?
f) Hallar un intervalo para el gasto promedio.
12.- Se desea hacer un estudio para examinar el papel que juega la televisin en la vida
de un grupo preseleccionado de personas de edades superiores a los 65 aos. El
propsito de dicho estudio es proporcionar informacin que permita hacer una
programacin adecuada a las necesidades de este grupo. Una muestra aleatoria de
siete personas de edades superiores a los 65 aos fue seleccionada y a cada persona
le fue solicitada la siguiente informacin:
N de horas TV : 0.5 0.8 0.9 1.6 2.8 3.0 3.3
Edad : 73 65 69 81 71 75 79
Escolaridad (aos) : 14 10 10 12 12 6 6
13.- Las pruebas acerca del consumo de combustible de un vehculo que viaja a
diferentes velocidades produjeron los siguientes resultados:
Velocidad : 20 30 40 50 60 70 80
Consumo : 18.3 18.8 19.1 19.3 19.5 19.7 19.8
a) Qu porcentaje de las variaciones en el consumo se pueden atribuir a otros
factores o a efectos aleatorios?
b) Con una confianza del 99%, se puede afirmar que un modelo lineal explica
la relacin existente entre velocidad y consumo?
c) Con una confianza del 90%, cul sera el mximo valor esperado para el
coeficiente de regresin poblacional?
d) Con una confianza del 99%, cunto se espera que sea el consumo promedio
si se sabe que la velocidad es 85?
e) Podemos concluir que hay una asociacin lineal entre ambas variables?
14.- El gerente de personal de una empresa considera que puede haber una relacin
entre el ausentismo (das), Salario (en miles de soles) y la edad (aos). Selecciona una
muestra aleatoria de 8 empleados, con los resultados siguientes:
Das ausente : 15 6 10 18 9 7 14 11
Edad : 27 61 37 23 46 58 29 36
Salario : 8.5 16.4 14.3 8.0 14.7 14.0 11.2 15.3
a) Encontrar los coeficientes de regresin mltiple.
b) Interprete el significado de las pendientes.
c) Predecir el nmero de das de ausencia de un empleado de 40 aos de edad
que gana S/ 13 000 al ao.
d) Sera adecuado un modelo lineal, usando la mejor variable predictora?
e) Hallar dicho modelo lineal, si fuera confiable.
f) Usando dicho modelo, realizar una estimacin intervlica.
g) Qu tanto se alejan los puntos del diagrama de esparcimiento con respecto
al plano de regresin?
16.- Los siguientes datos corresponden a las horas de estudio para una prueba y al
nmero de respuestas correctas obtenidas en dicha prueba por 17 alumnos.
Horas de estudio : 1 5 6 2 7 3
Respuestas correctas : 2 11 20 10 14 12
N de alumnos : 1 3 4 3 4 2
a) Si un modelo lineal es confiable, hallar un pronstico altamente significativo e
interpretarlo.
b) Qu tipo de relacin existe entre las variables involucradas? Por qu?
c) Calcular los errores de estimacin.
d) Cul ser el valor mximo esperado para el verdadero coeficiente de
regresin?
e) En cunto se alejan los valores observados con respecto a los valores
estimados?
17.- Los siguientes datos indican las ventas mensuales (en miles de soles) y los aos de
experiencia en ventas de diez vendedores de una fbrica.
A.E. : 4 5 2 5 6 7 1 8 3 7
Ventas : 5 6 4 5 7 10 3 11 4 9
18.- Una compaa asigna diferentes precios a un equipo de sonido particular en ocho
regiones diferentes del pas. Los siguientes datos muestran el nmero de unidades
vendidas y los precios correspondientes (en miles de soles).
Ventas : 5 8 10 13 16 22 28
Precio : 15 7 3 6 14 36 62
a) Se puede afirmar que el modelo parablico es el mejor ajuste?
b) Hallar el modelo de regresin parablico.
c) Se puede afirmar que los pronsticos que se realicen usando el modelo
parablico sern acertados? Por qu?
19.- Se realiz un estudio para determinar los efectos de no dormir en la capacidad de las
personas para resolver problemas sencillos. Un grupo de personas particip en el
estudio que consisti en dar a cada persona, despus de un periodo especfico sin
dormir, un conjunto de problemas sencillos de sumar y se registr el nmero de
errores. Se obtuvieron los siguientes resultados:
N.de errores : 9 6 8 14 16
N.horas sin dormir : 8 12 16 20 24
N. de personas : 3 2 3 4 5
a) Se puede afirmar que existe una relacin directa entre nmero de errores y
nmero de horas sin dormir? Explique el significado en este caso.
b) Hallar el plano de regresin.
c) Realizar un pronstico e interpretarlo.
d) Hallar un modelo lineal usando la mejor predictora. Interpretar a y b.
e) Los cambios que se producen en Y, se pueden atribuir a los cambios que
suceden en la mejor predictora?
f) Si la variable predictora se incrementa en una unidad, qu podemos esperar
que suceda con la variable predictando?
21.- A continuacin se presentan los datos obtenidos en un estudio realizado por una
cadena de supermercados para determinar la eficiencia de varios soportes
publicitarios sobre ventas. Los datos fueron obtenidos de las ventas semanales (en
miles de soles), de los gastos publicitarios en revistas, en televisin, en radio y en
boletines volantes distribuidos en casas.
Ventas : 365 649 441 807 450 828 314 472
Revista : 61 48 56 62 41 69 73 88
TV : 36 40 14 28 31 21 36 38
Radio : 13 7 8 6 3 0 5 6
Volante : 32 36 41 34 33 32 7 8
a) Sobre cul soporte publicitario se debera invertir? Por qu?
b) Hallar el modelo de regresin que permita estimar las ventas, teniendo en
cuenta los dos soportes publicitarios ms eficientes.
c) Qu porcentaje de las variaciones en las ventas se pueden atribuir a otros
factores o al azar?
d) Realice e interprete un pronstico.
e) Utilizando el mtodo paso a paso, hallar el mejor modelo de regresin.
23.- Una firma cree que sus ingresos anuales dependen de sus gastos por investigacin.
Se tiene la informacin de los ltimos seis aos (en miles de dlares).
Ingreso Anual : 31 40 30 34 25 20
Gastos en Investigacin : 5 11 4 5 3 2
a) Qu tipo de relacin existe entre el ingreso anual y los gastos en
investigacin? Por qu?
b) Podemos afirmar que existe una asociacin lineal entre ambas variables?
c) Se puede concluir que los cambios que se producen en la variable predictando
son atribuibles a los cambios de la variable predictora?
d) Para un gasto de investigacin de $8000, cunto se espera que sea el ingreso
anual promedio? Usar un nivel del 10%.
e) Si en investigacin se tuvo un gasto de $6000, cul ser el ingreso anual
esperado?
f) Al incrementarse el gasto en $1000, qu cambio se producir en el ingreso
anual?
24.- La empresa "Autos S.A.", fabricante de automviles, vende stos por medio de
distribuidores repartidos en todo el pas. El gerente de dicha compaa, ha logrado
desde el ao 2005 un crecimiento de las ventas de 28%. Muy orgulloso de este
resultado, lo atribuye sobre todo a la experiencia de sus vendedores. El ha
recolectado los siguientes datos mensuales de ventas en unidades y del nmero de
vendedores:
Ventas (unidades) : 25 35 33 44 28 20
N de vendedores : 7 12 9 16 10 6
26.- En una investigacin sobre la relacin que existe entre el nmero de veces que se
repite una tarea y los errores que se cometen se ha constatado la relacin curvilnea
existente entre ambas variables.
Veces repite : 6 8 11 13 16 17 18
N errores : 26 18 10 8 6 4 2
a) Hallar la ecuacin de regresin exponencial de la variable Y sobre X.
b) Realizar e interpretar un pronstico, usando el modelo hallado.
c) Los pronsticos que se realicen usando este modelo, sern cercanos a la
realidad? Por qu?
d) Si una tarea se repite 15 veces, cuntos errores se espera cometer en
promedio?
e) Por cada vez que se repita una tares, cmo variar el nmero de errores?
f) Cuntos errores se espera cometer, si la tarea se ha repetido diez veces?
g) Los cambios que se producen en el nmero de errores, los podemos atribuir
a los cambios en el nmero de veces que se repite la tarea?
h) Se puede afirmar que la relacin que hay entre ambas variables es lineal?
27.- Considerando la evolucin del producto bruto interno de un pas (millones dlares)
desde el ao 2002 al 2009 fue:
29.- Se tienen los siguientes datos que corresponden al espritu de iniciativa personal en
las situaciones de solucin de problemas. Se tom una muestra aleatoria de
ingenieros de sistemas.
Iniciativa Personal : 9 11 10 14 18 16 19 24
Madurez Emocional : 10 10 18 15 20 16 22 20
Seguridad en s mismo: 8 12 15 17 23 21 26 35
a) Si tuviera que hallar un modelo slo con una variable predictora, a cul
elegiras? Por qu?
b) Hallar un modelo lineal adecuado usando la mejor variable predictora.
c) Se puede afirmar que tanto la variable predictando como la variable
predictora, varan en el mismo sentido? Explica.
d) Podemos afirmar que la variacin de Y se puede atribuir a la variacin de X,
o se debe a fluctuaciones aleatorias?
e) Hallar la ecuacin del plano de regresin.
f) Qu puntaje se esperara en Iniciativa Personal para un ingeniero que tiene
30 en seguridad en s mismo y 19 en Madurez Emocional?
31.- Los siguientes datos corresponden a los CI verbal y no verbal as como las
calificaciones en Ingls, de un grupo de estudiantes del IV ciclo de ingeniera de
sistemas.
Calificacin : 70 60 80 95 90
CI Verbal : 110 90 100 140 120
CI No Verbal : 120 92 104 135 118
a) Calcular e interpretar el coeficiente de correlacin mltiple R1.23
b) Qu porcentaje de los cambios en las calificaciones lo podemos atribuir a los
cambios de ambas variables predictoras?
c) Hay una asociacin lineal entre las calificaciones y la mejor predictora? Usar
un nivel del 10%.
d) Si la variable predictora toma el valor 95, cunto se espera que sea la
calificacin promedio? Obtener una conclusin altamente significativa.
e) Qu tan alejados se encuentran los puntos del dispersigrama con respecto a
un modelo de regresin lineal?
Meses N turistas
Enero 13 a) Ajustar a los datos un modelo de
Febrero 17 Regresin parablica.
Marzo 38
Abril 42 b) Calcular el coeficiente de correlacin.
Mayo 40
Junio 34 c) Estimar cuntos turistas se espera recibir
Julio 30 para el mes de diciembre.
36.- Una compaa desea encontrar un modelo que explique la relacin existente entre la
produccin (miles de unidades por ao) y el costo marginal de produccin (dlares
por unidad).
Produccin : 5 7 9 9 11 12 12 14 16
Costo Marg. : 20 60 60 100 120 120 180 240 280
a) El asesor estadstico de la compaa asegura que el modelo que mejor describe
la relacin entre estas dos variables es un modelo exponencial, ests de
acuerdo con l? Por qu?
b) Hallar la ecuacin del modelo ms adecuado.
c) Si el modelo lineal es el mejor, realiza e interpreta un pronstico en forma de
intervalo.
37.- Se tienen los datos correspondientes a las edades (aos), los ingresos (dlares) y el
nmero de aos desde que salieron de la universidad de un grupo ingenieros de
sistemas que trabajan para la misma institucin.
Edad : 57 60 45 42 36 45 62 36 52
N de aos : 13 19 14 16 12 16 25 10 18
Ingresos : 512 650 550 500 540 680 680 456 590
a) Hallar un modelo lineal usando la mejor variable predictora.
b) Qu tipo de relacin existe entre ambas variables? Por qu?
c) Hallar el plano de regresin de Y sobre X1 y X2
d) Interpretar b1 y b2
e) Qu tanto explican a la variable predictando ambas variables predictoras en
forma conjunta?
f) Qu tanto se alejan los puntos del dispersigrama con respecto al plano de
regresin?
38.- Los siguientes datos son los ingresos por ventas mensuales, en centenas de $ que
obtuvo una compaa.
Mes : 1 2 3 4 5 6 7 8 9 10
Ingresos : 31 43 61 85 118 164 228 316 444 611
a) Podemos afirmar que un modelo exponencial es el ms adecuado en este
caso? por qu?
b) Encuentre la ecuacin del modelo ms adecuado.
c) Realice un pronstico puntual e interprete.
d) Calcular los valores estimados y los errores de estimacin.
e) Usando un modelo lineal, qu tan lejos estn los puntos del diagrama de
dispersin con respecto al modelo hallado?
f) Influye linealmente la variable predictora sobre la variable predictando.
g) Qu porcentaje de los cambios de Y no son explicados por un modelo lineal?
h) Hallar el valor mnimo esperado para el coeficiente de regresin.
FV : 37 13 35 10 17 33 15 22 20 28 20
CI : 135 92 135 97 103 118 104 124 110 115 113
I : 125 50 115 55 60 100 65 100 70 95 80
43.- Una compaa distribuye un test de aptitud entre todos sus nuevos representantes
de ventas. La direccin tiene inters en conocer la capacidad del test para predecir el
eventual xito de estos representantes. Los datos adjuntos recogen el valor (en miles
de soles) de las ventas semanales medias y las puntuaciones obtenidas en el test de
aptitud para una muestra aleatoria de ocho representantes.
Ventas semanales : 10 12 28 24 18 16 15 12
Puntuacin Test : 55 60 85 75 80 85 65 60
a) Se puede afirmar que un modelo lineal es un buen ajuste? Por qu?
b) Podemos afirmar que a mayor puntuacin obtenida en el test, se espera que
sus ventas semanales sean mayores? Por qu?
c) Si un representante obtuvo 72 puntos en el test, cul ser su venta semanal
esperada?
d) Para una puntuacin de 78 en el test, cunto se espera que sea la venta
semanal promedio?
45.- Estamos interesados en investigar cmo vara el peso (libras) con la altura (pulgadas)
y edad (aos) en los nios con una cierta deficiencia nutricional. Para tal efecto se
obtiene una muestra aleatoria de nios, obtenindose los siguientes resultados:
Peso 64 71 53 67 55 58 77 57 56 51 76 68
Altura 57 59 49 62 51 50 55 48 42 42 61 57
Edad 8 10 6 11 8 7 10 9 10 6 12 9
a) Podemos afirmar que ambas variables son buenas predictoras? Por qu?
b) Qu tanto de los cambios de la variable predictando se ven explicados por
un modelo de regresin lineal?
c) En qu medida se alejan los valores observados con respecto al modelo de
regresin?
d) Realizar e interpretar un pronstico, al nivel del 1%.
46.- Una tienda especialista en trajes para personas de negocios con xito intenta
determinar las variables que pueden explicar el nivel de compras de sus clientes. Se
recogieron datos de las compras por cada visita en dlares, los ingresos de los
clientes en miles y los aos de permanencia del cliente en su empleo. Se pensaba
que la ltima variable mide hasta dnde ha subido el cliente en la escala de puestos
de la empresa y, por tanto, refleja su necesidad de vestir con elegancia.
Compras : 630 550 320 820 450 755 750 330 950 655
Ingresos : 107 95 54 141 76 130 127 55 174 110
Aos Perm. : 12 12 6 16 10 15 14 9 22 13
Despus de recoger los datos, el director de la tienda se confiesa nulo en estadstica
y no tiene ni idea de qu hacer con ellos, puede ayudarle?
a) Hallar el plano de regresin.
b) Si el director tiene la oportunidad de servir a un cliente con un ao ms de
experiencia o a uno con 1000 ms de ingreso, a quin debe atender?
c) Permiten los datos determinar qu variable es la ms importante para
explicar las compras? Por qu?
Ansiedad : 8 10 12 16 14 18 22 23 19 26 28 27
Calificac. : 12 10 9 9 8 7 5 6 8 5 3 4
48.- Durante los ltimos cuatro aos, los gastos en publicidad y las ventas de una
empresa (en millones de pesetas) han sido:
49.- Se sospecha que la tasa de fallos de cierto componente electrnico est relacionada
con la temperatura. Se obtiene la siguiente muestra de la variable bidimensional:
(Temperatura grados Fahrenheit , Fallos en una hora x 106) = (X , Y)
50.- Una empresa que fabrica circuitos electrnicos aplica un riguroso control de calidad.
La produccin se lanza por lote de 100 circuitos y luego se prueba cada circuito. Los
circuitos defectuosos (por lote) son inmediatamente reparados por el servicio de
reparacin. Para poder planear adecuadamente la rotacin del personal obrero en el
servicio de reparacin, es importante poder predecir el tiempo (en minutos) requerido
en este servicio despus de la produccin de un lote. La empresa dispone de los
datos siguientes:
N defectuosos 1 2 3 4 4 5 6 6 7 8
Tiempo reparac. 23 29 49 64 74 87 96 97 109 119
a) Sera apropiado utilizar un modelo lineal para realizar pronsticos? Por qu?
b) Qu porcentaje de la variable predictando es explicado por un modelo de
regresin lineal?
c) Calcular e interpretar el error estndar de estimacin. 5.12
d) Con un margen de error del 5%, qu tiempo se utilizar en la reparacin cuando
se tienen 10 artculos defectuosos? 143.94 ; 164
e) Hallar un intervalo de confianza del 95% para la verdadera variacin que se
produce en el tiempo de reparacin por cada artculo defectuoso que se
incremente. 12.90 ; 16.46
f) Con una confianza del 90%, se puede afirmar que los cambios que se producen
en la variable predictando se pueden atribuir a los cambios de la variable
predictora? Por qu?
51.- Una empresa de desarrollo de software establece relacionar sus ventas en funcin
del nmero de pedidos de los tipos de software que desarrolla (Sistemas Educativos y
Automatizaciones Empresariales), para atender 10 proyectos en el presente ao. En
la siguiente tabla se muestra las ventas (en miles de soles), el nmero de pedidos de
sistemas, el nmero de pedidos de Aplicaciones Educativas y el nmero de pedidos
de Automatizaciones empresariales.
Ventas : 440 455 470 510 506 480 460 500 490
N Pedid. Sistemas : 50 40 35 45 51 55 53 48 38
N pedid. Aplic.Educat. : 105 140 110 130 125 115 100 103 118
N pedid. Automat.Empres. : 75 68 70 64 67 72 70 73 69
a) Hallar el plano de regresin. Interpretar: b1 y b 2
b) Qu tanto explica el plano de regresin hallado la relacin entre las variables
involucradas?
c) Realizar e interpretar un pronstico.
d) Hallar un modelo lineal usando la mejor predictora.
e) Influye linealmente la mejor predictora en la variable predictando?
f) Realiza un pronstico altamente significativo para las ventas promedio.
g) Realiza un pronstico significativo para las ventas.
52.- Una empresa informtica tiene un registro de productos de software al cual se les
midi el nmero de errores encontrados (en cientos de mdulos) y el nmero de
lneas de cdigo que posee (miles de lneas). Los datos se encuentran resumidos en la
tabla siguiente:
N lneas de cdigo : 10 15 15 20 20 25 25 35 35
N errores encontrados : 1 1 2 2 3 3 4 4 5
N de productos : 10 7 6 5 4 3 1 1 2
a) Si se usa un modelo lineal, seran acertados los pronsticos? Por qu?
b) Hallar el modelo lineal. Interpretar a y b.
c) En promedio, qu tanto se alejan los valores verdaderos con respecto a los
valores estimados?
d) Se puede afirmar que las variaciones en el nmero de errores encontrados
son independientes del nmero de lneas de cdigo?
e) Si el producto tiene 37000 lneas de cdigo, cuntos errores se espera
encontrar? Usar un nivel del 10%.
f) Entre qu valores se espera que est variando el verdadero coeficiente de
regresin?
g) Usando el modelo lineal hallado, calcular los errores de estimacin.
53.- En una empresa de servicio de Internet busca relacionar las ganancias que obtiene
cada computadora con el nmero de usuarios que ingresan a dicha cabina
diariamente. En la tabla representa las ganancias S/. y el nmero de usuarios.
54.- Los datos de la tabla adjunta muestran el tiempo en horas de impresin de trabajos
que se han impreso en una impresora lser de marca HP. Se est interesado en
estudiar la relacin existente entre la variable de inters tiempo de impresin de un
trabajo y la variable explicativa nmero de pginas del trabajo. Hacer el estudio en
base a los datos obtenidos en el muestreo y que son los siguientes:
Tiempo : 1 2 3 4 5 6 7 8
N Pgs. : 0.60 0.9 1.40 1.80 2.50 3.2 3.4 4.5
55.- El Gerente de Ventas de una compaa desea hallar un modelo que le permita
realizar pronsticos confiables de sus ventas semanales, para ello cuenta con la
siguiente informacin correspondiente a doce vendedores.
Ventas semanales Puntuacin Calificacin
CI
(en miles de soles) de la prueba de desempeo
5 4 2 90
12 7 5 105
4 3 1 88
8 6 4 95
11 10 6 110
4 9 5 98
30 2 10 120
14 5 5 115
6 9 4 92
14 2 6 110
4 1 1 95
5 3 1 90
35.5 38 30
85 73 90
57.- El ingreso anual (en miles de soles) disponible y los gastos de consumo de 9 familias,
seleccionadas aleatoriamente, en una zona de cierta ciudad han sido en miles de
dlares los siguientes:
Gasto : 7 12 18 30 20 24 8 11 8
Ingreso : 8 15 20 35 28 25 8 13 7
a) Se puede concluir que los cambios de la variable predictando se deben a
efectos aleatorios?
b) Hallar el alejamiento de los puntos del diagrama de dispersin con respecto al
modelo hallado.
c) Calcular los errores de estimacin.
d) Si el ingreso anual es 32000, cunto esperamos que sea como mximo el
gasto promedio? Obtener una conclusin altamente significativa.
e) Cunto se espera que sea como mnimo el gasto de consumo, si se sabe que
el ingreso anual es 18000?
58.- Un gerente de recursos humanos desea determinar el salario que debe pagar a cierta
categora de obreros. Para determinar dicho salario se realiza un estudio en el que
intervienen las variables Salario Mensual ($), Nivel de Produccin Anual en la
Empresa (en miles de dlares) y Nivel de Especializacin media del trabajador (de 0 a
10). El gerente obtiene los siguientes resultados:
Salario ($) : 123.4 135.7 115.9 100.6 98.7 150.4 124.6 110.0
Produccin : 300.5 325.9 298.6 200.9 300.4 359.8 279.6 215.6
Especializacin : 4.3 5.5 7.8 4.9 4.3 8.5 6.4 5.6
a) Calcular el plano de regresin lineal mnimo cuadrtico que explica el salario
en funcin de la produccin y del nivel de especializacin.
b) Qu salario se debera pagar si el nivel de produccin fuese de 315 mil
dlares y el nivel medio de especializacin de 6.6?
c) Calcular los valores estimados usando el plano de regresin.
d) Hallar los residuos.
e) Qu tanto se alejan los puntos del dispersigrama con respecto al plano de
regresin?
59.- Una empresa de ventas por Internet de productos informticos est interesada en
estudiar qu variables influyen en sus costes mensuales. Para ello recogieron los
costes de distribucin (en miles de dlares), las ventas (en cientos de miles de
dlares) y el nmero de rdenes de compras (en miles) de los ltimos 9 meses).
Costes : 5.30 7.17 8.56 6.37 7.28 6.84 5.25 7.08 8.20
Ventas : 3.86 4.46 5.12 4.01 4.57 4.58 3.01 4.84 5.17
a) Hay una asociacin lineal entre ellas?
b) Influyen las ventas en los costes mensuales? Usar un nivel del 1%.
c) Cunto ser como mximo el cambio que se produce en los costes cuando
las ventas se incrementen en cien mil dlares?
d) Si las ventas toman el valor 4.35, cunto se espera que sea el coste promedio
mensual? Usar un nivel del 10%
61.- Se lleva a cabo un control de gastos de mantenimiento para cada una de las cajas
registradoras de una cadena de tiendas de comestibles. Se tienen los datos
correspondientes a la antigedad (aos) y el gasto de mantenimiento (dlares).
Antigedad : 6 7 1 3 6 4 5 2 1 9 3
Gasto : 142 231 78 90 125 145 162 99 114 165 150
a) Hallar la ecuacin de un modelo lineal de regresin. Interpretar a y b.
b) Una caja registradora tiene 8 aos de antigedad, cul ser el gasto
promedio de mantenimiento?
c) Qu tanto de los cambios en el gasto de mantenimiento, lo podemos atribuir
a las variaciones en la antigedad de la caja registradora?
62.- Una agencia de viajes desea saber la relacin que hay entre las ventas (en miles), el
presupuesto destinado a publicidad y las comisiones de los vendedores; para esto
presenta los siguientes datos:
Gastos de Comisiones de
Ao Ventas
Publicidad Vendedores
2005 264 550 15840
2006 384 590 19250
2007 415 680 26013
2008 425 700 16896
2009 543 750 16290
a) Cul de las dos variables predictoras es la mejor?
b) Hallar la ecuacin del plano de regresin.
c) Qu tanto se alejan los puntos del diagrama de dispersin con respecto al
plano de regresin hallado?
64.- Hay una hiptesis que sugiere que el consumo de un producto dado, expresado en
unidades compradas por persona en un ao est influido por: el ingreso por persona
que trabaja y el tamao de habitantes de una ciudad. Se cuenta con los siguientes
datos:
Millones de Ingreso per cpita, en Consumo del producto,
habitantes por ciudad cientos $ por habitante unidades al ao
0.6 30 11
1.4 34 16
1.3 17 9
0.3 26 9
6.9 29 8
0.3 18 7
4.2 32 11
0.6 32 8
66.- Un psiclogo clnico est probando una tcnica aversiva para reducir el hbito de
fumar que consiste en dejar el cenicero sin limpiar durante todo el da. Acude un
sujeto a su consulta y le aplica esta tcnica. El psiclogo evala el nmero de
cigarrillos fumados al da antes del tratamiento y durante varios das, obteniendo los
siguientes resultados:
Das : 0 2 4 6 7
N cigarrillos : 25 15 14 9 4
a) Ser apropiado ajustar un modelo lineal? Por qu?
b) Los cambios producidos en la variable predictando, se pueden atribuir a los
cambios de la variable predictora?
c) Con una confianza del 90%, qu podemos afirmar acerca del coeficiente de
regresin lineal?
67.- Las materias primas empleadas en la produccin de una fibra sinttica son
almacenadas en un lugar en donde no se tiene control de la humedad. La siguiente
tabla refleja en porcentajes la humedad relativa del almacn y la humedad observada
en las materias primas, durante un estudio que se llev a cabo:
Hum.relativa : 41 53 59 65 71 78 50 65 74
Hum.observada : 1.6 13.6 19.6 25.6 31.6 33.2 14.7 21.2 28.3
a) Analizar los datos utilizando un modelo de regresin lineal.
b) Construir un intervalo de confianza para la media de la humedad de las
materias primas si la humedad relativa del almacn es igual a 69.
c) Cunto valdra la humead en las materias primas si se consigue una
humedad relativa de 35? Obtener una conclusin altamente significativa.
d) Se puede concluir que ambas variables estn relacionadas linealmente?
Unid.Defect. : 1 2 3 4 4 5 6 6 7 7
Tiempo : 23 29 49 64 74 87 96 97 109 109
a) Se puede concluir que los cambios que se producen en el tiempo de
reparacin se deben a efectos aleatorios?
b) Qu se puede afirmar acerca del verdadero cambio que se produce en la
variable predictando cuando las unidades defectuosas se incrementan en
una.
c) Para ocho unidades defectuosas, cunto se espera que sea el tiempo de
reparacin?
d) Se puede concluir que ambas variables estn asociadas linealmente?
e) Calcular los errores de estimacin.
69.- Se desea analizar el nmero de errores cometidos por una persona en relacin con
las horas que lleva desarrollando un trabajo.
N errores : 1 2 4 4 6 6 7 8 6 5
Horas Trabaj. : 10 10 8 6 6 3 4 2 5 8
a) Hallar un modelo cuadrtico.
b) Sern acertados los pronsticos que realicemos con este modelo? Por qu?
c) Qu tanto de los cambios en el nmero de errores queda explicado por un
modelo de regresin cuadrtico?
d) En cuanto se alejan los valores observados con respecto a los valores
estimados?
70.- Se sugiere que el gasto en alimentacin por familia, expresado en cientos de dlares
por mes, est influenciado directamente por el ingreso familiar mensual en cientos
de dlares.
Ingreso : 30 34 17 26 29 18 32 32
Gasto : 21 26 5 19 18 7 23 25
a) Es correcto lo que se afirma?
b) Se puede hablar de una asociacin lineal entre gasto en alimentacin e
ingreso familiar?
c) Cunto se espera que sea el gasto promedio, si se sabe que el ingreso
familiar es 24 cientos de dlares?
71.- En base a una muestra de doce datos se quiere ajustar un modelo de regresin de la
variable respuesta, precio en euros por el que se adquiri una impresora lser,
respecto a las variables regresoras: nmero de pginas por minuto que es capaza de
imprimir y aos de antigedad de la impresora. Los datos del estudio son los
siguientes:
Precio : 466 418 434 487 516 462 475 501 594 553 551 589
N pgs. : 6 6 6 6 8 8 8 8 12 12 12 12
Antig. : 6 4 2 0 6 4 2 0 6 4 2 0
72.- Una empresa fabricante de cereales para el desayuno desea conocer la ecuacin que
permita predecir las ventas (en miles de euros) en funcin de los gastos en
publicidad infantil en televisin (en miles de euros), el tiempo diario de aparicin en
televisin (en minutos) y los gastos en publicidad en los peridicos (en miles de
euros). Se realiza un estudio en el que se renen los datos mensuales
correspondientes a los ltimos 20 meses. Estos datos aparecen en la siguiente tabla:
Ventas : 10 12 1113 12 14 16 12 14 11 10 19 8
Public. TV : 1.0 1.2 1.3 1.4 1.5 1.7 1.8 1.3 1.4 0.9 0.8 0.9
Tiempo TV : 50 57 56 55 60 65 69 67 68 67 97 66
Public.Per. : 0.4 0.4 0.5 0.5 0.4 0.4 0.6 0.5 1.1 0.3 0.5 0.6
a) Hallar el plano de regresin usando las dos mejores predictoras.
b) Hallar los valores estimados.
c) Calcular los errores de estimacin.
d) Usando un modelo lineal con la mejor predictora, realiza un pronstico para
las ventas promedio.
e) Se puede concluir que existe una asociacin lineal entre las ventas y la
mejor predictora?
f) Cunto se espera que sea como mximo el coeficiente de regresin lineal?
Eficacia P1 P2 P3 P4
410 69 68 59 55
569 57 54 31 63
425 77 72 80 45
300 81 65 38 50
324 70 60 49 41
280 53 82 49 43
280 77 74 60 41
450 76 66 47 64
380 65 54 50 46
584 97 62 62 68
434 76 70 54 57
a) Cul de las tres pruebas es la mejor predictora? Por qu?
b) Hallar el modelo de regresin usando las dos mejores predictoras.
c) El plano de regresin hallado, permitir realizar pronsticos confiables? Por
qu?
d) Utilizando la mejor predictora, hallar la ecuacin de regresin.
e) Se puede afirmar que la mejor predictora influye en la eficacia?
f) Qu tan lejos se encuentran los puntos del diagrama de dispersin con
respecto a la recta de regresin?
g) Cunto se espera que sea como mnimo el verdadero coeficiente de
regresin? Obtener una conclusin altamente significativa.
h) Si la puntuacin en la prueba es 70, cunto se espera que sea como mnimo
la puntuacin en eficacia?
i) Se afirma que existe una relacin directa entre la eficacia y la calificacin
obtenida en la prueba 3, es correcta dicha afirmacin? Por qu?