Sunteți pe pagina 1din 9

Universidad Católica Boliviana "San Pablo"

Probabilidad y Estadística II
Práctica No.4
Octubre - 2019

1 Regresión Lineal Simple


1. El director de personal de una empresa tiene el interés de determinar el monto de ventas diarias en
Bs. que realizan los agentes vendedores de la empresa. Suponiendo que se desea establecer el monto de
ventas, como función de los años de experiencia de los vendedores,mediante la función lineal

yt = 0 + 1 xi + "i

Considerando los siguientes datos, hallar la recta de regresión lineal estimada:

Años de experiencia (X) 6 5 3 1 4 3 6 2 6 4


Montos de venta (Y) 9 6 4 3 3 5 8 2 7 4

2. Se tienen los siguientes resultados de las observaciones de las variables x y y :


16
X 16
X 16
X 16
X 16
X
xi = 96; yi = 64; x2i = 657; yi2 = 526; xi yi = 492
i=1 i=1 i=1 i=1 i=1

(a) Calcular las sumas:


16
X 16
X 16
X
(xj x)2 ; (yi y)2 ; (x x)(y y)
i=1 i=1 i=1

(b) Calcular la receta de regresión mínimo cuadrádica, que estima a:

yi = 0 + 1 xi + "i

(c) Escribir las ecuaciones normales para el punto b)


(d) Calcular la recta de regresión mínimo cuadrática
0 0
xi = 0 + 1 yi + "i

(e) Escribir las ecuaciones normales para el punto d)

3. El número de clientes de un centro comercial está en función de la distancia en kilómetros, con relación
al nucleo de la densidad poblacional de cierta región, los datos …guran en la siguiente tabla:

Nº de clientes (x) 8 7 6 4 2 1
Distancia (y) 15 19 25 23 34 40

(a) Calcular el coe…ciente de correlación lineal


(b) Si el centro comercial se sitúa a 2 km¿Cuántos clientes puede esperar?
1
(c) Si desea recibir a 500 clientes, ¿a qué distancia del núcleo de población debe situarse?

4. Un conjunto de datos bidimensional (X; Y ) tiene coe…ciente de correlación r = 0:9, siendo las medidas
de las distribuciones marginales X = 1; Y = 2:Se sabe que una de las cuatro ecuaciones siguientes
corresponde a la recta de regresión de Y sobre X:

y= x+2

3x y=1
2x + y = 4
y =x+1
Seleccionar razonadamente esta recta.
5. Se solicitó a un grupo de 50 personas información sobre el número de horas que dedican diariamente a
dormir y ver la televisión. La clasi…cicón de las respuestas ha permitido elaborar la siguiente tabla:

Nº de horas dormidas(x) 6 7 8 9 10
Nº de horas televisión(y) 4 3 3 2 1
Frecuencias Absolutas (ni) 3 16 20 10 1

(a) Calcular el coe…ciente de correlación


(b) Determinar la ecuación de la recta de la recta de regresión de Y y X
(c) Si una persona duerme ocho horas y media, ¿cuántas horas ve televisión?

6. Un inversionista desea conocer la relación que existe entre el ingreso anual de familias (X) y sus ahorros
anuales (Y ) en miles de dólares. De una muestra recogida entre 9 familias sobre sus ingresos y ahorros
anuales, se obtuvieron los siguientes datos.

Ingreso anual (X) 12 13 14 15 16 17 18 19 20


Ahorro anual (Y) 0 0,1 0,2 0,2 0,5 0,5 0,6 0,7 0,8

De…nido el modelo de regresión lineal ;


2
Y = 0 + 1 xi +" siendo " N (0; ) y corr ("i ; "j ) = 08 i 6= j

(a) Obtener estimaciones puntuales e insesgadas de los parametros del modelo


(b) Utilizar la ecuación estimada para predecir los ahorros anuales de una familia cuyo ingreso anual
es 26.000 $us
(c) Estimar el coe…ciente 0 mediante un intervalo del 95% de con…anza. Interprete y comente el
resultado
(d) Obtener un intervalo de estimación del ahorro (Y ); correspondiente a un nivel de ingreso x0 =
18:000$us. Interpretar el resultado obtenido
(e) Probar la validez del modelo con el 5% de nivel de signi…cación

7. Una empresa desea determinar si existe relación entre el dinero gastado en investigación y las utilidades
anuales. La tabla siguiente contiene información de 6 años

Gastos (miles $us) x 5 11 4 5 3 2


Utilidad y 31 40 30 34 25 20

(a) Hallar y^ = ^ 0 + ^ 1 x, y probar la hipótesis de que el coe…ciente de regresión 1 es 2.1. Usar


= 0:10
2
(b) Hallar un intervalo de con…anza del 90% para una utilidad esperada cuando el gasto en investi-
gación fue de 9
(c) Hallar un intervalo de con…anza del 90% para una utilidad futura si el gasto en investigación fuera
de 7

8. Para un mismo conjunto de datos (x; y) se han obtenido los modelos ajustados por mínimos cuadrados
7
X
y^ = 6:25 0:7x ; x
^ = 5:39 0:3y; y 2 = 110; X = 4
i=1

Hallar las siguientes suma de cuadrados: SCE,SCT,SCR


9. En una distribución bidimensional de frecuencias sabe que la recta de regresión de mínimos cuadrados
es:
y^ = 73 0:6x
La media de x es 8, la desviación típica de x es 2, y la desviación estándar de y es 5. Calcular el
coe…ciente de correlación y la media aritmética de y.
10. Para ajustar una curva de Gompertz de la forma:

y = ee + x

Escribir las ecuaciones normales correspondientes para estimar los parámetros y .


11. Escribir las ecuaciónes normales que permitan ajustar una muestra de datos a una función cuando:

(a) y =
(b) y = 10 + x
(c) y =

12. Estimar por el método de mínimos cuadrados los parámetros a y b de la ecuación y = a + bx2 con la
muestra de tres punto siguientes
(y; x); (3; 1); (4; 0); (6; 1)

(a) Escribir las ecuaciónes normales


(b) Hallar la ecuación de regresión ajustada

13. Ajustar por el método de mínimos cuadrados una curva de la forma:


1
y^ = 5 +
^ + ^x
A los siguientes datos:
x 1 2 3 4 5
y 6 5,25 5,8 3,75 3,5

14. Para un mismo grupo de observaciones de las variables x y y, se ha obtenido las dos rectas de regresión
siguientes:
3x + 2y = 26
6x + 2y = 32
En función de las mismas, responda a las siguientes cuestiones:

(a) ¿Qué valores tomarían las medias de x y y?


(b) Represente grá…camente ambas rectas de regresión
3
(c) Determine el valor del coe…ciente de correlación lineal r.
(d) ¿Por qué la regresión de y sobre x y la de x sobre y no coinciden?

15. A partir de un conjunto de valores de las variables x y y , se ha determinado la regresión de y sobre


x;obteniéndose la siguiente recta:

y^ = 10 + 0:45x; R2 = 0:9; x = 20

A partir de la de…nición de la anterior recta, determinar los parámetros de la recta de x sobre y, es


decir de la regresión
^ = b00 + b01 y
x

16. Una publicación presenta datos sobre la resistencia a la comprensión (X) y la permeabilidad (Y ) de
varias mezclas y tratamientos de concreto. El resumen de cantidades es el siguiente:
X X X X X
n = 14; Xi = 43; Yi = 572; Xi2 = 157:42; Yi2 = 23530; Xi Yi = 1697:80

Suponga que las dos variables están relacionadas de acuerdo con el modelo de regresión lineal simple

Y = 0 + 1X +"

(a) Calcular las estimaciones de mínimos cuadrados de la pendiente y de la ordenada al origen


(b) Utilizar la ecuación de la recta ajustada para predecir la permeabilidad que será observada cuando
la resistencia a la compresión sea X=4
(c) Proporcionar una estimación puntual de la permeabilidad promedio cuando la resistencia a la
compresión sea X=3.7
(d) Suponga que el valor observado de la permeabilidad para X=3.7 es Y = 46.1. Calcular el valor
del residuo (error) correspondiente.

17. Para un conjunto de datos (x; y) se conocen los siguientes resultados :

n = 16; x = 6; y = 4; Sx = 2:324; Sy = 4:2427; r = 0:728

Calcular:

(a) La varianza de error Se2


(b) La recta mínimo cuadrática y^ = b0 + b1 x

18. Una muestra de 20 observaciones sobre el ingreso personal (x) y ahorro personal (y) de un país, dieron
los siguientes resultados:
X X X X X
xi = 186:2; yi = 21:9; (xi x)2 ; (yi y)2 = 86:9; (xi x)(yi y) = 106:4

Se desea estimar la función de ahorro:

yi = 0 + 1 xi +"

(a) Estimar (puntualmente) todos los parámetros del modelo


(b) Efectuar una interpretación correcta de los valores de 0 y 1
(c) Estime 1 mediante un intervalo con…dencial de 95%
(d) Estime el valor esperado del ahorro, correspondiente a un ingreso personal …jado en 12, y halle un
intervalo de con…ana del 95% para este valor esperado

19. De una aplicación del análisis de regresión se conocen los siguientes resultados:

Sx2 = 5:4; Sy2 = 18; x = 6; y = 4; r = 0:728

Hallar:
4
(a) La recta de regresión mínimo cuadrática

y^ = ^ 0 + ^ 1 x

(b) El coe…ciente de determinación R2

20. De una aplicación del análisis de regresión se conocen los siguientes resultados:

n = 5; Sy2 = 20 y R2 = 0:845

Calcular la varianza residual S"2 :


21. Se disponen de las rectas
2x + y = 4
3x + 2y = 5
Determinar:

(a) La primera recta de regresión y sobre x, es decir, y^ = b0 + b1 x, y la segunda recta de regresión x


^ = b00 + b01 y
sobre y, es decir, x
(b) El coe…ciente de determinación
(c) El coe…ciente de correlación lineal

22. Se disponen de 5 observaciones para dos variables, x y y.

Xi 1 2 3 4 5
Yi 3 7 5 11 14

(a) Trazar un diagrama de dispersión para estos datos


(b) ¿Qué indica el diagrama de dispersión obtenido en a) acerca de la relación entre las dos variables?
(c) Ajustar por mínimos cuadrados estos datos a una recta de la forma:

yi = 0 + 1 xi +"

(d) Usar la ecuación de la regresión para producir el valor de y cuando x = 6


(e) Calcular SCT,SCR y SCE y el coe…ciente de determinación. Comentar la bondad de ajuste.
(f) Probar la signi…cación del modelo:

H0 : 1 =0 vs H1 : 1 6= 0 con = 0:05

(g) Veri…car la hipótesis anterior con un nivel de signi…cación 0.05, presentar los resultados en una
tabla de análisis de varianza (ANOVA).

23. El siguiente modelo ajustado por mínimos cuadrados, a una muestra de datos, donde x representa los
gastos en publicidad e y es el volumen de ventas que realiza una empresa comercial es:

y^i = 0:9 + 0:5xi

Además se sabe que:


E [x] = 4; E x2 = 18:8 y E y 2 = 9:7
Calcular el coe…ciente de correlación R2 , e interpretar este resultado.

5
24. Para un mismo conjunto de datos (x; y) se han obtenido los modelos ajustados por mínimos cuadrados:
7
X
y^ = 6:25 0:7x; x
^ = 5:39 0:3y; y 2 = 110; x = 4
i=1

Hallar el estimador de la varianza S 2 :


25. Una aplicación importante de análisis de regresión a la contaduría es la estimación de costos. Con n = 6
datos sobre volumen de producción y costos y empleando el método de mínimos cuadrados, obtener
la ecuación de regresión estimada que relacione volumen de producción y costos. Se dispone de los
siguientes resultados:
X X X X X
x = 327; y = 30; xy = 1682; x2 = 18397; y 2 = 166

(a) Con estos datos obtener la ecuación de la regresión estimada para pronosticar los costos totales
dado un volumen de producción. Calcular e interpretar el coe…ciente de determinación.
(b) Calcular SCT,SCE y SCR.

26. Para un mismo conjunto de datos (x,y) se han obtenido los modelos ajustados por mínimos cuadrados:
6
X
y^ = 9:933 0:1714x; x
^ = 4:7 0:1286y; y 2 = 546
i=1

Hallar el estimador de la varianza Se2 :


27. En un estudio referido al gasto total (x) y los gastos en alimentación (y) diaria sobre 16 familias de
ingresos altos, se obtuvo la siguiente información:
X X X X
yt = 1936; log xi = 38:4471; yi log xi = 4878:4049; (log xi )2 = 94:4289

Hallar las ecuaciones normales y determinar los coe…cientes a y b de la función del tipo:

yi = a + b log xi

28. La información estadística obtenida de una muestra de tamaño 12 sobre la relación existente entre
la inversión hecha y el rendimiento obtenido en miles de euros para exportaciones agropecuarias se
muestra la tabla siguiente:

Inversión 11 14 16 15 16 18 20 31 14 20 19 11
Rendimiento 2 3 5 6 5 3 7 10 6 10 5 6

(a) Calcular el coe…ciente de correlación lineal, así como la recta de regresión. Calcular además, la
previsión de inversión que se obtendrá con un rendimiento de 8000
(b) ¿Presenta la muestra su…ciente evidencia, a un nivel de signi…cación de 0.05, como para rechazar
la hipótesis nula sobre la pendiente(H0 :pendiente de la recta es cero)?

29. Sea (x,y) una variable aleatoria bidimensional con función de densidad conjunta f (x; y) = xy si
0 x 1; 0 y 1. Hallar la recta de regresión y sobre x.
30. Al efectuar u análisis de regresión entre dos variables x e y, aplicando mínimos cuadrados, se obtuvo:

y^ = 3:6 0:10x

la media de x es 6, la desviación típica de x es 2.45 y la de y es 1.41. Calcular el coe…ciente de correlación


y la media aritmética de y.
6
31. Los siguientes datos pertenecen al residuo de cloro que hay en una piscina en diferentes momentos
después de ser tratada con sustancias químicas:

Número de horas (x) 2 4 6 8 10 12


Residuo de cloro (y) 1.8 1.5 1.4 1.1 1.1 0.9

(a) Ajuste la recta de mínimos cuadrados a partir de la cual podamos predecir el residuo de cloro en
términos del número de horas transcurridas desde que la piscina fue tratada químicamente.
(b) Utilice la ecuación de la recta de mínimos cuadrados para determinar el residuo de cloro en la
piscina cinco horas después del tratamiento químico.

32. Los siguientes datos corresponden a los precios de venta y de cierta marca y el modelo de automóviles
usados durante x años:

Años de uso ( x) 1 2 3 4 5 6
Precio (y) 6800 5400 5100 4500 4200 3600

(a) Determine la curva de regresión no lineal, aplicando una transformación adecuada.


(b) Estime el precio de venta de un vehículo de tiene 8 años de uso.

33. Se toma una muestra de 25 obreros de una fábrica. Se pide a cada obrero que valore su satisfacción
en el trabajo (x) en una escala de 1 a 10. Se averigua también el número de días que estos obreros
estuvieron ausentes del trabajo (y) en año pasado. Se estima la recta de regresión muestral por mínimos
cuadrados para estos datos.
y^ = 12:6 1:2x
También se ha observado que:
25
X
x = 0:6; (x x)2 = 130; SCE = 80:6
i=1

(a) Contraste al nivel de signi…cación del 1 % la hipótesis de que en la satisfacción en el trabajo no


produce ningún efecto lineal en el absentismo frente a la hipótesis alternativa bilateral adecuada.
(b) Un obrero tiene un nivel de satisfacción de 4. Halle un intervalo al 90% del número de días que
este obrero estaría ausente del trabajo en un año.

34. Se ha intentado evaluar la tasa de in‡ación como predictor del tipo de cambio en el mercado. Partiendo
de una muestra de 79 observaciones trimestrales, se obtuvo la regresión lineal estimada:

y^ = 0:0027 + 0:7916x

Donde
y= variación efectiva del tipo de cambio
x=variación del tipo al contado predicha por la tasa de in‡ación
El coe…ciente de determinación era 0.097 y la desviación típica estimada del estimador de la pendiente
de la recta de regresión poblacional era 0.2759.

(a) Interprete la pendiente de la recta de la regresión estimada.


(b) Interprete el coe…ciente de determinación.
(c) Contraste la hipótesis nula de que la pendiente de la recta de regresión poblacional es 0 frente a
la hipótesis alternativa de que la verdadera pendiente es positiva e interprete su resultado.
(d) Contraste la hipótesis nula de que la pendiente de la recta de regresión poblacional es 1 frente a
la hipótesis alternativa bilateral.
7
35. Un analista cree que el único determinante importante de los rendimientos de los activos (y) del banco
es el cociente entre préstamos y los depósitos (x). En una muestra aleatoria de 20 bancos se obtuvo la
recta de regresión muestral y^ = 0:97 + 0:47x con el coe…ciente de determinación de 0.720.

(a) Halle la correlación muestral entre los rendimientos de los activos y el cociente entre los prestamos
y los depósitos.
(b) Contraste la hipótesis nula de que no existe una relación lineal entre los rendimientos y el cociente
frente a una hipótesis alternativa bilateral.

36. En un determinado hotel, el responsable de la piscina del mismo debe añadir periódicamente un com-
puesto de cloro al agua para mantenerla en buenas condiciones. Dicha persona ha observado la relación
existente entre el número de días que dura el efecto del producto (variable y ) y los gramos de cloro
empleado (variable x), obteniendo los siguientes resultados:
* COV (x; y) = 5:4; Sx2 = 12
* El porcentaje de varianza explicada por la regresión lineal de y sobre x del 78.387%.
*A partir de la regresión lineal de y sobre x , el valor estimado para 21 gramos de cloro sería de 4 días.
*x = 25 gramos
A partir de esta información, determine ambas rectas de regresión y , en función de ellas, calcule que
cantidad de cloro habría que utilizar para que los efectos del producto duren 7 días.
37. Una compañía discográ…ca ha recopilado la siguiente información sobre 15 grupos musicales, a saber,
el número de conciertos dados este verano y las ventas de discos de estos grupos (en miles de discos),
obteniendo los siguientes datos:
Discos 10-30 30-50 50-70
1-6 3 2 1
6-11 1 4 1
11-16 2 1 5

(a) Obtener la recta de regresión que explica la dependencia lineal.


(b) Calcular el número medio de discos vendidos por estos grupos.
(c) Si un grupo musical ha vendido 1800 discos. ¿Qué número de conciertos de prevé este verano?

38. Un banco central de cierto país está estudiando la posibilidad de bajar los tipos de interés para incentivar
la inversión privada, y así abrir la posibilidad de creación de puestos de trabajo. Para ello contrasta los
tipos de interés real de diferentes países con la inversión privada de los mismos (en miles de $), todo ello
durante el último periodo . Obteniéndose los resultados que aparecen re‡ejados en la siguiente tabla:

Tipo de interés
0.05-0.10 0.10-0.15 0.15-0.20 0.20-0.25
10-50 2 6
INVERSIÓN en miles 50-100 1 5
de USD 100-150 1 4
150-200 5 1

(a) Construya la recta de regresión que explica la inversión en función de los tipos de interés real.
(b) ¿Cómo variaría la inversión si se produce un incremento de una unidad en los tipos de interés real?
Razonar sin la necesidad de hacer ningún cálculo.
(c) Si el tipo de interés real baja de 0.18 a 0.09, ¿Cómo variaría la inversión?

39. La inversión k y el producto interior bruto se relacionan mediante la expresión y = ak 2 , denominada


función cobb-douglas.
8
(a) Ajustar esta función a los datos siguientes
(b) Medir la calidad del ajuste potencial.

x 2,6 2,9 3,4 4,1 5,1 6 7,2 9,2 11,2 13,1 15,2 17,3 19,9
y 0,6 0,6 0,8 1 1,3 1,4 1,6 1,9 2,2 2,5 2,9 3,5 3,9

40. En un depósito cilíndrico, la altura del agua que contiene varía conforme pasa el tiempo según esta
tabla:
Tiempo(h) 8 22 27 33 50
Altura (m) 17 14 12 11 6

(a) Halla el coe…ciente de correlación lineal entre el tiempo y la altura e interpretar.


(b) ¿Cuál será la altura del agua cuando hayan transcurrido 20 horas?.
(c) Cuando la altura del agua es de 2m, suena una alarma, ¿Qué tiempo habrá que pasar para que
avise la alarma?

41. En una cofradía de pescadores las capturas registradas de cierta variedad de pescados, en kilogramos y
el precio de subasta en lonja, en euros/kg, fueron los siguientes:

X (kg) 2000 2400 2500 3000 2900 2800 3160


Y (euros kg) 1,8 1,68 1,65 1,32 1,44 1,5 1,2

(a) ¿Cuál es el precio medio registrado?


(b) Halla el coe…ciente de correlación lineal e interpretar.
(c) Estimar el precio que alcanzaría en la lonja el kilo de esa especie si se pescasen 2600kg

S-ar putea să vă placă și