Documente Academic
Documente Profesional
Documente Cultură
Ingeniera en Biotecnologa
Estadstica I
Sasha Sigenza
Camila Velandia
Mayra Valverde
1
de una variable
Y =a+bX ,
x 1 es un valor de la
(x i , ^
y i ) , es un punto de la recta de la regresin
Y =a+bX
. Fig 1
Fig1. Desviaciones de valores ajustados y observados.
Cuando la funcin, es lineal
a= y b x , donde el coeficiente de
es la
Si
La covarianza:
( x ix ) ( y i y )
cov ( x , y )= i=1
n1
y i y 2
i=1
i=1
2
x
S =
2
-1
cor ( x , y ) ) 1
cor ( x , y )=cor ( y , x )
a , b , c ,d
Datos homocedsticos
Datos heterocedsticos
observado
^
yi
d i= y i ^
yi
del valor
(x i , y i ) , es el
( y i ^
y i )2=
i=1
d 2i =
i=1
i=1
[ y i(a+ bxi )]
i=1
^ 0= y 1 x
.
x i x
i=1
( xi x )( yi y )
1=
i=1
^ 0= y 1 x
.
y = ^ 0 + 1 x .
n
Covarianza
( x i x ) ( y i y )
S XY = i=1
xi 2
Varianza X
i=1
n
S XX = X 2i
i=1
Y i 2
Varianza Y
i=1
n
S YY = Y 2i
i=1
e2i
2= i=1
n
, pero es un estimador
es la varianza residual,
y i y
e 2i
s 2R = i=1 , donde e 2i =
n2
i=1
Inferencias sobre el modelo de regresin
El estimador
lineal de normales,
6
( x ix )
i=1
(n1) S2x
1=
yi= 0+ 1 xi+ui
donde
1
yi
es un estimador insesgado de
n
( x ix )
i=1
(n1)S x
E [ 1 ]=
yi N ( 0+ 1 xi , 2 )
. Adems,
1.
E [ y i ]= 1
y su varianza es,
n
Var [ 1 ]=
(
i=1
( x i x )
(n1) S2x
Por tanto,
1
1,
(n1)S2x
Como
de nivel 1 .
S 2R . El resultado bsico
2
R
S
(n1) S2x
t n2
S2R
2
( n1)S x
| |
1
S 2R
>t n2,/2
(n1) S2x
| |
1
pvalor=t n 2 >
S 2R
(n1)S 2x
El estimador
^ 0
lineal de normales,
n
^ 0= 1 x w i y i
i=1 n
w i=( xi x )/n S 2x y
donde
y i N ( 0 + 1 xi , )
n
y i= O + 1 x 1 +ui
donde
. Adems,
que
cumple
es un estimador insesgado de
que
,
1
E [ ^ 0 ]= x wi E [ y i ]= 0
i=1 n
y su varianza es,
n
1
1
x
Var [ ^0 ]= x w i Var [ y i ]= 2 +
n (n1)S 2x
i=1 n
y por tanto,
( (
x 2
^ 0 N 0 , 2 1 +
n (n1) S 2x
))
SR
de nivel 1 .
. El resultado basico
1
x 2
S2R +
n (n1)S 2x
t n2
x 2
^ 0 t n2,/2 S 2R 1 +
n (n1) S2x
0:
. En
| (
S2R
^ 0
2
1
x
+
n (n1)S 2x
>t n2,/ 2
( | (
pvalor=2 Pr t n2 >
SR
^0
2
1
x
+
n (n1)S 2x
|)
1
x
x 0x 2 Var ( ^ 1 )= 2 +
n (n1)S 2x
Var ( ^
y 0 )=Var ( y ) +
El intervalo de confianza para la respuesta promedio es
10
(
2
^y 0 t n2,/2 S R
1
x 2
+
n ( n1)S2x
0x 2
((n1)S 2x )
1
1+ +
n
2
SR
^y 0 t n2,/2
La longitud de este intervalo es mayor que la del anterior (menos precisin)
porque no corresponde a un valor medio sino a uno especfico.
Resolucin de ejercicios
Ejercicio 1: Los datos de la produccin de trigo en toneladas (X) y el
30
28
32
25
25
25
22
24
35
25
30
27
40
42
40
50
45
30
40
25
10
x i y in x y
^
1= i=110
x i2 n x2
i=1
97341028,635,4
^
1=
=1,3537
84681028,62
^
0= y ^
1 x
11
^
0=35,4+1,353728,6
^
0=74,116
La recta de regresin es:
y=74,1161,3537 x
Ejercicio2: Una empresa de mensajera de entrega puerta a puerta,
82
5
3,5
21
5
1,0
107
0
4,0
55
0
2,0
48
0
1,0
92
0
3,0
135
0
4,5
32
5
1,5
67
0
3,0
121
5
5,0
dispersion
Distancia vs Tiempo
f(x) = 0x + 0.01
R = 1
tiempo
0
Y
3,5
1
4
x*y
2887,5
215
4280
550
480
2
1
1100
480
x^2
680625
46225
114490
0
302500
230400
y^2
12,25
1
16
4
1
12
920
1350
3
4,5
2760
6075
846400
9
182250
20,25
0
325
1,5
487,5
105625
2,25
670
3
2010
448900
9
1215
5
6075
147622
25
5
7620
28,5
217170 580644
812,25
00
Ejercicio 3: Se han medido en cm, los dimetro x, de cien rboles
a1,30m del suelo, es decir, los dimetros normales y las alturas y
en metros de estos rboles, los resultados obtenidos despus de
agrupar en clases son:
5,7
7,9
9,11
11,13
13,15
15,17
17,19
10
14
13
15
Calcular
a)
b)
c)
d)
La medias y desviaciones
Covarianza
Los coeficientes de correlacin
Ecuacin de la recta de regresin lineal
Resolucin
a) En primer lugar se determinan las marcas de clase y las frecuencias
marginales.
2
xi
ni
ui
ui ni
ui ni
25
8
13
35
25
25
25
45
44
55
23
23
23
65
12
24
Totales
n=100
80
Para la variable x:
x i45
u
=
= x i=45+10 ui
i
Siendo
10
5
ui ni
u = i=0
6
=0,06
100
x =45+ 10 u =45,6 cm
5
ui2 ni
S u2= i=0
u2 =
80
2
( 0,06 ) =0,7964= S u= 0,7964
100
S u=0,8924
S x 2=10 2 Su2=79,64
S x =10 Su =8,924
Anlogamente para y;
v j=
Siendo
v j12
= y i=12+2 v j
2
v j nj
v = j=1
16
=0,16
100
y =12+2 v =11,68 cm
14
v j2 n j
S v 2= j=1
v 2=
164
2
(0,16 ) =1,6144= S v = 1,6144
100
S u=0,8924
S y 2=22 S v 2=6,4576
S y =2 Sv =2,5412
10
12
14
16
18
7
xi
2
5
3
5
4
5
5
5
6
5
-3
-2
-1
v j n ij
-2
1,-3
1,-2
0,0
0,0
0,0
0,0
0,0
-5
10
-1
2,-6
10,20
8,-8
5,0
0,0
0,0
0,0
-34
34
0,0
1,-2
14,14
13,
0
15,1
5
1,2
0,0
0,0
0,0
3,-3
9,0
6,6
5,1
0
0,0
13
13
0,0
0,0
0,0
1,0
2,2
2,4
1,3
18
ui {v j
j=1
Total
5
j=1
75
ui v j nij
S uv = i=1
ui v j nij
j=1
u v =
75
( 0,06 ) (0,16 )=0,7596
100
S xy =20 S uv =15,1920
c) La ecuacin de la recta de regresin lineal de y sobre x es:
15,1920
y11,68=
( x 45,6)
79,64
y11,68=0,1908( x45,6)
d) El coeficiente de correlacin
15
r xy =
15,1920
=0,669
(8,924)(2,5412)
r uv =
0,7596
=0,6699=r xy
(0,8924)(1,2706)
Yi
3,1
9,8
15,4
19,5
24,5
31,0
Xi
Yi
( Xi)2
(Yi)2
XiYi
1
2
3
4
5
6
Total
0,8
1,65
2,7
3,8
4,75
5,35
19,05
3,1
9,8
15,4
19,5
24,5
31
103,3
0,64
2,7225
7,29
14,44
22,5625
28,6225
76,2775
9,61
96,04
237,16
380,25
600,25
961
2284,31
2,48
16,17
41,58
74,1
116,375
165,85
416,555
Xi 2
Yi 2
Sxx = X i 2
Syy = Y i2
16
19,05 2
Sxx =76,2775
103,3 2
Syy =2284,31
Sxx =15 ,7 9
Sxy = XiYi
Xi Yi
Sxy =416,555
19,05103,3
6
Xi
X =
N
Yi
Y =
N
430,59
m=
15,79
19,05
X =
6
103,3
Y =
6
m=27 , 269 9
X =3,175
Y =17,216
m=
Sxy
Sxx
b=Y m X
b=17,21627,26993,175
b=69,3659325
Syym2Sxx
N2
Desviacin estndar de la
pendiente:
Sm=
Sr 2
Sxx
505,83(27,27)215,79
62
Sm=
Sr =53 , 0010596 4
Sm=13,337 8
Desviacin estndar de la
interseccin:
Sr =
(53)2
15,79
17
i
X 2
X i2
N
1
Sb=Sr
Sb=
2
Sr
1 1 ( Y c Y )
+ + 2
m
M N m Sxx
M: muestras desconocidas.
N: puntos.
X es igual a 3,065639 cuando Y=14,23.
19,05
76,28
6
1
Sb=53
Sb=47 ,54759 8
1.5
117.
4
1.5
117.
1
1.5
106.
2
2.0
131.
9
2.0
146.
9
2.2
146.
8
2.4
133.
9
2.5
111.
3
2.5
123.
0
2.8
125.
1
2.8
145.
2
3.0
134.
3
3.0
144.
5
la
En
16
la
3.2
143.
7
3.3
146.
9
Y =2075.6
Sxy =112.2
Y 2=272908.02
X
2
2
X
Sxx =
X Y =4937.97
1=15.6485
0=Y 1 X
0=129.725 (15.6485 )( 2.325 )
0=93.3422
37.2 2
Sxx =93.66
Sxx =7.17
Y =93.3422+15.6485 X
Tabla de contenido
Regresin lineal simple............................................................................................... 1
Medidas de dependencia lineal:..............................................................................2
La covarianza:................................................................................................ 2
Linealidad:..................................................................................................... 2
Homogeneidad:.............................................................................................. 3
Homocedasticidad:........................................................................................ 3
Independencia:.............................................................................................. 3
Normalidad:................................................................................................... 3
20