Sunteți pe pagina 1din 7

Regresion lineal

Problema 1

Los datos de la tabla adjunta muestran el tiempo de impresin de trabajos que se han
imprimido en impresoras de la marca PR. Se est interesado en estudiar la relacin existente
entre la variable de inters tiempo de impresin de un trabajo y la variable explicativa
nmero de pginas del trabajo.Hacer el estudio en base a los datos obtenidos en el muestreo
y que son los de la tabla adjunta.

Problema 2.

En la tabla adjunta se presentan el nmero de pginas y el precio de doce libros tcnicos:

pginas precio pginas precio pginas precio

310 3'50 400 8'00 420 2'50

300 3'50 170 1'80 610 5'00

280 3'50 430 7'00 420 5'40

310 7'30 230 3'20 450 3'70

1. Ajustar una recta de regresin por mnimos cuadrados.

Problema 3.

La resistencia del cemento depende, entre otras cosas, del tiempo de secado del cemento
. En un experimento se obtuvo la resistencia de bloques de cemento con diferente tiempo de
secado los resultados fueron los siguientes:
Tiempo (das) Resistencia (kg/cm2)

1 13'0 13'3 11'8

2 21'9 24'5 24'7

3 29'8 28'0 24'1 24'2 26'2

7 32'4 30'4 34'5 33'1 35'7

28 41'8 42'6 40'3 35'7 37'3

1. Analizar la posible existencia de una relacin entre estas dos variables.

2. Si se utilizase un ajuste cuadrtico se obtienen mejores resultados?

Problema 4

La variable representa en miles, el nmero de asnos en Espaa y la el tanto por ciento


del presupuesto del Estado dedicado a Educacin.

ao Y X ao Y X ao Y X

192 1.00 5'5 194 747 9'7 197 476 12'7


0 6 5 0
192 1.16 4'8 195 732 9'6 197 386 11'5
5 2 0 5
193 1.47 7'8 195 683 8'9 198 368 11'4
0 9 5 0
193 805 8'2 196 686 11'4
5 0
194 795 8'6 196 493 10'6
0 5

1. Representar grficamente estos datos.

2. Construir la recta de regresin que explique el comportamiento de la variable tanto por


ciento del presupuesto del Estado dedicado a Educacin en funcin de la variable el
nmero de asnos en Espaa e interpretar los resultados

3. Representar las variables X e Y frente al tiempo.

Problema 5
Se llev a cabo un estudio para determinar la relacin entre el nmero de aos de experiencia
y el salario mensual, en miles de pesetas, entre los informticos de una regin
espaola. Para ello, se tom una muestra aleatoria de 17 informticos y se obtuvieron los
siguientes datos

Exper. Salario Exper. Salario Exper. Salario

13 26'1 31 36'4 27 36'0


16 33'2 19 33'8 25 36'5
30 36'1 20 36'5 7 21'4
2 16'5 1 16'9 15 31'0
8 26'4 4 19'8 13 31'4
6 19'1 10 24'6

1. Calcular la regresin lineal de la variable salario frente a aos de experiencia.

Problema 6

El siguiente conjunto de datos era tomado sobre grupos de trabajadoras de Inglaterra y Gals
en el perodo de 1970-72. Cada grupo est formado por trabajadores de la misma profesin
(mdicos, trabajadores textiles, decoradores,...etc,) y en cada uno de los veinticinco grupos
muestreados se han observado dos variables: el ndice de estandarizado de consumo de
cigarrillos (variable regresora, x) y el ndice de muertes por cncer de pulmn (variable
dependiente, y).

1. Estudiar el modelo de regresin lineal del ndice de mortalidad frente al ndice de


fumadores.

x y x y x y

77 84 102 88 133 146


137 116 91 104 115 128
117 123 104 129 105 115
94 128 107 86 87 79
116 155 112 96 91 85
102 101 113 144 100 120
111 118 110 139 76 60
93 113 125 113 66 51
88 104

Problema 7

Anscombe utiliz el siguiente conjunto de datos para demostrar la importancia de los grficos
en el anlisis de regresin y correlacin. Hay cuatro conjuntos de datos bidimensionales
, el vector X es el mismo para los tres primeros conjuntos.
X1 = Y 1 Y2 Y3 X4 Y4
X2 =
X3

10 8'04 9'14 7'46 8 6'58

8 6'95 8'14 6'77 8 5'76

13 7'58 8'74 12'74 8 7'71

9 8'81 8'77 7'11 8 8'84

11 8'33 9'26 7'81 8 8'47

14 9'96 8'10 8'84 8 7'04

6 7'24 6'13 6'08 8 5'25

4 4'26 3'10 5'39 8 5'56

12 10'84 9'13 8'15 8 7'91

7 4'82 7'26 6'42 8 6'89

5 5'68 4'74 5'73 19 12'50

1. Calcular la recta de regresin de Y frente a X en estos cuatro conjuntos de datos.

2. Dibujar la grfica de Y frente a X, qu conclusiones se deducen?

Problema 8

En 34 lotes de 120 libras de cacahuetes se observ el nivel medio de aflatoxin (partes por
billn) y el porcentaje de cacahuetes no contaminados en cada lote .

X Y X Y X Y X Y X Y

3'0 99'97 18'8 99'94 46'8 99'86 12'3 99'95 25'8 99'85
1 2 3 6 8
4'7 99'97 18'9 99'93 46'8 99'81 71'3 99'82 18'8 99'97
9 2 1 1 5
8'3 99'98 21'7 99'90 58'1 99'87 12'5 99'97 30'6 99'98
2 8 7 2 7
9'3 99'97 21'9 99'97 62'3 99'79 12'6 99'88 36'2 99'95
1 0 8 9 8
9'9 99'95 22'8 99'98 70'6 99'85 15'9 99'96 39'8 99'90
7 5 5 1 9
11'0 99'96 24'2 99'93 71'1 99'78 16'7 99'98 44'3 99'85
1 3 8 2 9
83'2 99'83 83'6 99'71 99'5 99'64 111'2 99'65
0 8 2 8
1. Analizar estos datos e investigar la relacin entre estas dos variables para predecir Y
en funcin de X. Es adecuado el ajuste lineal?

Problema 9

En quince casas de la ciudad de Milton Keynes se observ durante un perodo de tiempo la


diferencia de temperatura promedio (en grados centgrados) entre la temperatura en la calle y
la temperatura en casa, y el consumo de gas diario en kWh.

Dif. temp Consum Dif. temp Consum Dif. temp Consum


o o o

10'3 69'81 13'4 75'32 15'6 86'35


11'4 82'75 13'6 69'81 16'4 110'23
11'5 81'75 15'0 78'54 16'5 106'55
12'5 80'38 15'2 81'29 17'0 85'50
13'1 85'89 15'3 99'20 17'1 90'02

1. Hacer una grfica de los datos. Existe relacin entre estas dos variables?

2. Se puede explicar el consumo de gas por una relacin lineal con la diferencia de
temperatura?

Problema 10

Se midi la altura (en centmetros) y el peso (en kilogramos) de treinta chicas de once aos del
Heaton Meiddle School de Bradford. Estudiar estos datos y la relacin entre ambas variables.

Altura Peso Altura Peso Altura Peso Altura Peso Altura Peso

135 26 141 28 149 46 148 32 149 32


146 33 136 28 147 36 149 34 141 32
153 55 154 36 152 47 141 29
154 50 151 48 140 33 164 47
139 32 155 36 143 42 146 37
131 25 137 31 146 35 137 34
149 44 143 36 133 31 135 30

1. Dibujar la grfica de estas observaciones y calcular la recta de regresin de peso frente


a la altura y la de altura frente a peso.

2. En la regresin lineal de peso frente a altura, se observa alguna observacin atpica?.

Problema 11

El contenido en hierro de las escorias de los altos hornos puede ser determinada por una
prueba qumica en laboratorio o, de forma ms barata y ms rpida, por un test magntico. Se
est interesado en estudiar la relacin entre los resultados del test qumico y del test
magntico. En particular, se desea saber si a partir de los resultados del test magntico se
pueden estimar los resultados del test qumico sobre el contenido del hierro. Para ello, se han
realizado los dos test a un conjunto de lotes recogidos secuencialmente en el tiempo. Los
resultados obtenidos los de la tabla adjunta.

1. Analizar estos datos. Hacer un estudio descrptivo y grfico de los mismos.

2. Estudiar la relacin entre los tests.

Qui Mag Qui Mag Qui Mag Qui Mag Qui Mag Qui Mag

24 25 18 19 17 12 21 18 20 21 25 16
16 22 20 10 19 15 24 22 24 18 15 16
24 17 21 23 16 15 15 20 24 20 16 26
18 21 20 20 15 15 20 21 23 25 27 28
18 20 21 19 15 15 20 21 29 20 27 28
10 13 15 15 13 17 25 25 27 18 30 30
14 16 16 16 24 18 27 22 23 19 29 32
16 14 15 16 22 16 22 18 19 16 26 28
25 28 25 36 32 40 28 33 25 33

Problema 12

Los siguientes datos representan el Producto Nacional Bruto de USA y los gastos de
consumo en miles de millones de dlares de 1972, entre los aos 1960-1980

Ao 1960 1961 1962 1963 1964 1965 1966

PNB 737'2 756'6 800'3 832'5 876'4 929'3 984'8

GC 452'0 461'4 482'0 500'5 528'0 557'5 585'7

Ao 1967 1968 1969 1970 1971 1972 1973

PNB 1.011'4 1.058'1 1.087'6 1.085'6 1.122'4 1.185'9 1.255'0

GC 602'7 634'4 657'9 672'1 696'8 737'1 768'5

Ao 1974 1975 1976 1977 1978 1979 1980

PNB 1.248'0 1.233'9 1.300'4 1.371'7 1.436'9 1.483'0 1.480'7

GC 763'6 780'2 823'7 863'9 904'8 930'9 935'1

1. Ajustar un modelo lineal e interpretar los coeficientes de regresin simple.

2. Hacer la grfica de los residuos estandarizados frente al tiempo.

Problema 13
Los datos de la tabla adjunta son el conjunto clsico de datos del test psicolgico de Strong
sobre retencin de memoria. Los datos se tomaban de la siguiente manera: un conjunto de
individuos memorizaban una lista de objetos inconexos y pasado un tiempo la recordaban. La
variablep indicael porcentage de retencin de memoria en promedio y la variable tes el tiempo
transcurrido. El objetivo del estudio era explicar la variable pen funcin de t.

t p t p t p t p

1 0'84 60 0'54 720 0'36 100 0'08


80
5 0'71 120 0'47 144 0'26
0
15 0'61 240 0'45 288 0'20
0
30 0'56 480 0'38 576 0'16
0

1. Analizar este conjunto de datos y estudiar la relacin de la variable p respecto a t.

Problema 14

La dureza de los rboles es difcil de medir directamente, sin embargo la densidad si es


relativamente fcil de medir. Por ello es de gran inters disponer de un modelo que permita
predecir la dureza de un rbol a partir de su densidad. Por este motivo se ha tomado una
muestra de 36 eucaliptos australianos y se les midi su densidad (X) y su dureza (Y). Los
resultados obtenidos son los de la tabla adjunta.

Densidad Dureza Densidad Dureza Densidad Dureza

24'7 484 39'4 1210 53'4 1880


24'8 427 39'9 989 56'0 1980
27'3 413 40'3 1160 56'5 1820
28'4 517 40'6 1010 57'3 2020
28'4 549 40'7 1100 57'6 1980
29'0 648 40'7 1130 59'2 2310
30'3 587 42'9 1270 59'8 1940
32'7 704 45'8 1180 66'0 3260
35'6 979 46'9 1400 67'4 2700
38'5 914 48'2 1760 68'8 2890
38'8 1070 51'5 1710 69'1 2740
39'3 1020 51'5 2010 69'1 3140

En base a estos datos,

1. Estudiar el modelo de regresin lineal de Y respecto a X.

A handbook of small data sets, editado por D.J. Hand, F. Daly, A.D. Lunn, K.J. McConway y E
Ostrowsky. Chapman & Hall.

S-ar putea să vă placă și