Documente Academic
Documente Profesional
Documente Cultură
300
250
REGRESIN
200
150
0
10
15
20
100
50
f(x)=ax+b
R2=0.99
25
Diseos correlacionescausales
X1
Y1
X1
Y1
X2
Y2
X2
Y2
X3
Y3
X3
Y3
CORRELACIONAL
CAUSAL
Enfermedad
diarreica aguda y
su relacin con la
calidad del agua de
consumo. Bejucal
2003-2007
EL COEFICIENTE DE CORRELACIN DE
PEARSON
xy
SxS y
-0,5
Dbil
Inversa
Moderada Fuerte
Directa Directa
Dbil
Directa
0
No existe
correlacin
0,5
0,9
1
Perfecta
Directa
Ejemplo 01:
Con la finalidad de determinar si la
cantidad de horas invertidas en
estudiar est relacionado con las
calificaciones obtenidas, un profesor
tom una muestra de 10 estudiantes
y registr el tiempo (en horas) por
da que dedica cada alumno al
estudio y la calificacin obtenida al
final de ao. Los datos se muestran a
continuacin:
Tiempo
3
1.5
2
2
1.4
4
4.5
5
3
2.5
Notas
15
10
10
12
8
17
19
19
14
12
1.5
2.0
2.5
3.0
3.5
4.0
4.5
5.0
5.5
b.- Coeficiente:
r
S xy
SxS y
4.27
0.879
3.86 *1.26
Interpretacin:
Existe una correlacin moderada entre las calificaciones y
las horas dedicadas al estudio, y esta es directa.
1
S xy ( xi x )( yi y )
n i
REGRESION
El propsito del anlisis de regresin es usar los datos o valores
observados de las variables, para realizar estimaciones, en base
a una relacin funcional. El anlisis de regresin sirve para
predecir una medida en funcin de otra medida (o varias).
Y
Y = Variable dependiente
predicha
explicada
X = Variable independiente
predictora
explicativa
Y = f(X) + error
f es una funcin de un tipo determinado
el error es aleatorio, pequeo, y no depende de X
SY
b1 r
SX
b0 (ordenada en el origen, constante)
b0 y b1 x
Ejemplo:
Tomamos los datos del ejemplo nmero 01, y obtenemos
los coeficientes:
b1 (pendiente de la recta)
SY
3.86
b1 r
0.879 *
2.706
SX
1.26
b0 (ordenada en el origen, constante)
Solucin
Por lo tanto la recta de regresin = b0 + b1X, estar
determinada de la siguiente manera:
= 5.78 2.706X
Interpretacin:
b0= 5.78 (En promedio un alumno desaprueba cuando no
dedica tiempo al estudio X=0)
b1= 2.71 (En promedio una persona gana 2.71 puntos por
cada hora dedicada)
Ejemplo 02:
Un trabajo estadstico asignado a un
grupo de estudios consiste en
obtener un modelo de regresin
lineal a nivel descriptivo para
predecir las ventas semanales de un
producto especifico en funcin de la
publicidad del producto por la radio.
Para esto han recopilado al azar los
tiempos de duracin en minutos de
la publicidad de 10 semanas y el
respectivo
numero
unidades
vendidas del producto. Los datos se
dan en la tabla que sigue:
Publicidad Ventas
20
50
30
73
30
69
40
87
50
108
60
128
60
135
60
132
70
148
80
140
Ejemplo 02:
Se pide:
a. Graficar los datos y describa su tendencia
b. Obtenga la recta de regresin lineal simple
c. Calcule r
d. Si se da 100 minutos de propaganda, cuanto ser la
venta de una semana?
e. Segn la regresin obtenida, si la publicidad de una
semana cualquiera se incrementa en 5 minutos, Cunto
sera el incremento promedio de las ventas?
Ejemplo 03:
Ejemplo 03:
Mes
Pasajeros
(miles)
Y
Publicidad
(miles $)
X
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
15
17
13
23
16
21
14
20
24
17
16
18
23
15
16
10
12
8
17
10
15
10
14
19
10
11
13
16
10
12
Ejemplo 04:
CONSUMO
COMPLEMENTO
NUTRICIONAL
1
1,5
2
2,5
3
3,5
4
4,5
5
5,5
VARIACION DE
PESO
8
10
9
12
14
13
15
17
14
14
Anlisis de Varianza.
Donde:
SCR b1 SPXY
SCE SCT SCR
SCT SCY
SCX x nx
2
SCY y ny
2
2
2
SPXY xy nyx
Coeficiente de Determinacin
SC
Re g
SCR
R
SCT
SCT
2
CME
0
SCX
n nSCX
b00 t( n 2,1 / 2) S
b11 t( n 2,1 / 2) S
b0 b1 x0 t( n 2,1 2) S e
1 ( xo x)
n
SCX
1 ( xo x)
b0 b1 x0 t( n 2,1 2) S e 1
n
SCX
t0
0 0
S 0
tn2
t0
1 1
S 1
tn2