Sunteți pe pagina 1din 10

Capitulo VIII.

Las regresiones

Ejercicios

1) Para estudiar el efecto de las aguas residuales de las alcantarillas que


afluyen a un lago, se toman medidas de la concentracin de nitrato en el
agua. Para monitorizar la variable se ha utilizado un antiguo mtodo
manual. Se idea un nuevo mtodo automtico. Si se pone de manifiesto
una alta correlacin positiva entre las medidas tomadas empleando los
dos mtodos, entonces se har uso habitual del mtodo automtico. Los
datos obtenidos son los siguientes:
Manual = X

25 40 120 75 150 300 270 400 450 575

Automtico = Y 30 80 150 80 200 350 240 320 470 583

Comprobar la idoneidad del modelo lineal de regresin. Si el modelo es


apropiado, hallar la recta de regresin de Y sobre X y utilizarla para predecir la
lectura que se obtendra empleando la tcnica automtica con una muestra de
agua cuya lectura manual es de 100. Realizar el ejercicio en R

SOLUCION
Manual = X
25
40
120
75
150
300
270
400
450
575
2405

Automtico
=Y
30
80
150
80
200
350
240
320
470
583
2503

625
1600
14400
5625
22500
90000
72900
160000
202500
330625
900775

750
3200
18000
6000
30000
105000
64800
128000
211500
335225
902475

> datos=read.table("agua.txt", header=T)


> attach(datos)
> datos
x y
1 25 30
2 40 80
3 120 150
4 75 80
5 150 200
6 300 350
7 270 240
8 400 320
9 450 470
10 575 583
> regresion<-lm(y~x,data=datos)
> regresin
Call:
lm(formula = y ~ x, data = datos)
Coefficients:
(Intercept)
x
26.1150
0.9322
> summary(regresion)
Call:
lm(formula = y ~ x, data = datos)
Residuals:
Min 1Q Median 3Q Max
-78.98 -18.57 14.31 23.53 44.24
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 26.11496 21.20188 1.232 0.253
x
0.93216 0.07064 13.195 1.04e-06 ***
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 40.11 on 8 degrees of freedom
Multiple R-squared: 0.9561, Adjusted R-squared: 0.9506
F-statistic: 174.1 on 1 and 8 DF, p-value: 1.036e-06

Se observa el intercepto=26.11496 y el valor de x=0.93216, adems de que


entrega el valor de R=0.9561, valor que garantiza en cierta forma el uso del
modelo lineal para el problema

Y m X bn
Y=0.9(100)+26.11=116.11

2) Sobre una hoja de papel cuadriculado dibuje aproximadamente 5


cuadrados de diversos tamaos.

a. Cuntos cuadritos encierra cada uno de los cuadrados dibujados?.


Represente esta variable mediante la letra N
b. Cunto mide el lado de cada cuadrado?. Represente esta variable
mediante la letra L
c. Coleccione su informacin en una tabla de datos.
d. Existe alguna relacin entre una y otra variable?. Detalle su respuesta.
Represente las parejas (L,N) en un plano cartesiano
e. Qu clase de curva obtiene?

Solucin

1
4
9
25
36
75

1
2
3
5
6
17

>cuadrititos=read.table("cuadras.txt",header=T)
> attach(cuadrititos)
> cuadrititos
NL
1 11
2 42
3 93
4 25 5
5 36 6
> regresion <- lm(L ~ N, data = cuadrititos)
> summary(regresion)
Call:
lm(formula = L ~ N, data = cuadrititos)
Residuals:
1
2
3
4
5
-0.4895 0.1011 0.4188 0.2353 -0.2658

NL
1
16
81
625
1296
2019

1
8
27
125
216
377

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.35302 0.28808 4.697 0.01826 *
N
0.13647 0.01434 9.519 0.00246 **
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 0.4287 on 3 degrees of freedom
Multiple R-squared: 0.968, Adjusted R-squared: 0.9573
F-statistic: 90.61 on 1 and 3 DF, p-value: 0.002459
> plot(cuadrititos)
> abline(lm(L~N))

3) A partir de las siguientes observaciones para 5 aos de las variables X e


Y, ajstese el modelo de regresin de Y en funcin de X ms idneo.
Donde:
Y: produccin nacional de un subsector industrial, en millones de toneladas.
X: tiempo
Ao

1995

1,25

1996

1997

11,25

1998

20

1999

30,5

4) Cinco nias de 2,4, 6,7 y 8 aos pesan respectivamente 15, 19, 25, 38, y
34 kilogramos respectivamente, entonces una nia de 12 aos pesara
aproximadamente:
A. 45
B. 55

C. 15
D. 51
E. 61
5) En el anlisis de Regresin lineal se puede afirmar todo lo siguiente
excepto:
A. Ajusta los datos a una lnea recta
B. Predice valores de una variable si se conoce el valor de la otra
C. Establece una relacin cuantitativa entre dos variables relacionadas
D. El mtodo grfico para determinar la relacin entre dos variables es
ms concreto que el mtodo matemtico o de mnimos cuadrados
E. Una relacin lineal entre dos variables queda representada por una lnea
recta llamada ecuacin de regresin
6) Dado Los siguientes datos expuestos en la tabla
Edad

Estatura

60

80 100 110

112

La frmula de regresin para los datos propuestos est dada por:


A. y = 11,5x + 67,5
B. y = 7,5x + 85,5
C. y = 13,4x + 52,2
D. y = 14,4x + 47
E. y = 14x + 48,8

7) El Grafico para los puntos dispersos est dado por:


120

100

100

80

80

60

60

40

40

20

20

0
0

120

120

120

100

100

80

80

60

60

40

40

20

20

0
0

8) El diagrama de dispersin para la regresin lineal est dado por

120

120

100

100

80

80

60

60

40

40

20

20

0
0

120

120

100

100

80

80

60

60

40

40

20

20

0
0

Capitulo IX: Medidas de asimetra y apuntamiento

1) Los siguientes datos corresponden a 100 salarios tomados en una


encuesta aplicada a 380 habitantes de Villavicencio. Determinar en R
el grado de asimetra de los datos. establecer una conclusin.
289000

350000

886900

310000

650000

961200

320000

756000

1200000

345000

289000

350000

889000

320000

665500

965000

320000

756000

1300000

320000

289000

350000

890000

320000

689500

996000

320000

759600

1700100

750000

289000

566700

896500

320000

689500

999000

340000

759600

1700100

1120000

310000

566700

900000

320000

690000

1000000

340000

789000

1700100

345000

310000

566700

936200

320000

690000

1025000

340000

789000

1700100

863000

310000

600000

942500

320000

699000

1025000

340000

800000

1700100

886000

320000

700000

1096000

320000

699000

1063000

340000

800000

1700100

345000

320000

700000

1116300

345000

859600

1777000

340000

800000

1700100

850000

320000

750000

1120000

345000

862300

1800000

345000

800000

1700100

1750000

>salarios=c(289000,350000,886900,310000,650000,961200,320000,756000,1200000,345000,289000,350000,889000,
320000,665500,965000,320000,756000,1300000,320000,289000,350000,890000,320000,689500,996000,320000,759
600,1700100,750000,289000,566700,896500,320000,689500,999000,340000,759600,1700100,1120000,310000,5667
00,900000,320000,690000,1000000,340000,789000,1700100,345000,310000,566700,936200,320000,690000,102500
0,340000,789000,1700100,863000,310000,600000,942500,320000,699000,1025000,340000,800000,1700100,886000,
320000,700000,1096000,320000,699000,1063000,340000,800000,1700100,345000,320000,700000,1116300,345000,
859600,1777000,340000,800000,1700100,850000,320000,750000,1120000,345000,862300,1800000,345000,800000,
1700100,1750000)
> par(mfrow=c(1,2))

> f=table(salarios)
> dd <- density(salarios)
> barplot(f)
> plot(dd,add=T)

> summary(salarios)
Min.

1st Qu. Median

Mean 3rd Qu.

Max.

289000 340000 700000 750900 947200 1800000

Esta es una asimetra positiva ya que


2) En una distribucin asimtrica negativa:
A.
B.
C.
D.
E.

La moda se encuentra entre la media y la mediana


La moda est ubicada a la derecha de la media
La media es menor que la desviacin tpica
La media es menor que la mediana
La moda y la mediana son iguales
3) Los momentos de segundo orden con respecto a la media de dos
distribuciones son 9 y 16, mientras que los momentos de tercer orden
son 8.1 y 12. 8 respectivamente. La distribucin ms asimtrica es:

A.
B.
C.
D.

La primera porque tiene mayor grado de deformacin


La primera porque tiene menor grado de deformacin
La segunda porque tiene mayor grado de deformacin
La segunda porque tiene menor grado de deformacin

4) Uno de los siguientes enunciados es verdadero

A. La media en una muestra de datos agrupados la divide en dos


partes.
B. Una distribucin de datos permite calcular todas las medidas de
tendencia central
C. La moda es un dato que permite analizar un resultado esperado
D. Una medida de dispersin est libre del clculo de la media.
5) En el anlisis de regresin lineal se puede afirmar todo lo siguiente,
excepto
A.
B.
C.
D.
E.

Ajusta todos los datos a una lnea recta


Predice el valor de una variable si se conoce el valor de la otra
Establece una relacin cuantitativa entre dos variables
El mtodo grafico es ms concreto que el mtodo matemtico
Una relacin lineal de datos queda representada por una recta.

A.
B.
C.
D.
E.

6) Dado que el grado de asimetra de una distribucin es de 2,27, la


media es de 189,87 y la mediana 189,16, entonces la varianza toma
un valor correspondiente a:
0.93
0.88
0.78
1.88
1.78

A.
B.
C.
D.
E.

7) Tomando una distribucin ligeramente asimtrica, calcular la moda


sabiendo que su media es igual a 3 y que la diferencia entre la media
y la mediana es igual a -2
2.9
0.9
19
9
1/9

8) En la siguiente distribucin de datos el coeficiente de asimetra segn


el coeficiente de Pearson es:

Xi
f
A.
B.
C.
D.
E.

1
2

2
8

3
3

4
5

5
7

6
5

2
1/3
3
1

Capitulo X medidas de concentracin

1) Retome los 100 datos y elabore una tabla en R para determinar el


coeficiente de Gini. Utilice la librera ineq, y compare los resultados.
Establezca conclusiones

289000

350000

886900

310000

650000

961200

320000

756000

1200000

345000

289000

350000

889000

320000

665500

965000

320000

756000

1300000

320000

289000

350000

890000

320000

689500

996000

320000

759600

1700100

750000

289000

566700

896500

320000

689500

999000

340000

759600

1700100

1120000

310000

566700

900000

320000

690000

1000000

340000

789000

1700100

345000

310000

566700

936200

320000

690000

1025000

340000

789000

1700100

863000

310000

600000

942500

320000

699000

1025000

340000

800000

1700100

886000

320000

700000

1096000

320000

699000

1063000

340000

800000

1700100

345000

320000

700000

1116300

345000

859600

1777000

340000

800000

1700100

850000

320000

750000

1120000

345000

862300

1800000

345000

800000

1700100

1750000

> library(ineq)
>salarios=c(289000,350000,886900,310000,650000,961200,320000,756000,1200000,345000,289000,350000,889000,320000,665
500,965000,320000,756000,1300000,320000,289000,350000,890000,320000,689500,996000,320000,759600,1700100,750000,289
000,566700,896500,320000,689500,999000,340000,759600,1700100,1120000,310000,566700,900000,320000,690000,1000000,34
0000,789000,1700100,345000,310000,566700,936200,320000,690000,1025000,340000,789000,1700100,863000,310000,600000,9
42500,320000,699000,1025000,340000,800000,1700100,886000,320000,700000,1096000,320000,699000,1063000,340000,80000
0,1700100,345000,320000,700000,1116300,345000,859600,1777000,340000,800000,1700100,850000,320000,750000,1120000,34
5000,862300,1800000,345000,800000,1700100,1750000)
> g=ineq(salarios,type="Gini")
>g
[1] 0.3122976
> plot(Lc(salarios),col="darkred",lwd=2)

S-ar putea să vă placă și