Sunteți pe pagina 1din 34

350

300

250

REGRESIN

Moving average trend line with period = %PERIOD


R = NaN

200

150
0

10

15

20

100

50

f(x)=ax+b
R2=0.99

PROF. THAINNA LEYVA


SNCHEZ

25

Diseos correlacionescausales
X1

Y1

X1

Y1

X2

Y2

X2

Y2

X3

Y3

X3

Y3

CORRELACIONAL

CAUSAL

RELACION ENTRE VARIABLES Y


REGRESION

Enfermedad
diarreica aguda y
su relacin con la
calidad del agua de
consumo. Bejucal
2003-2007

Estudiar si hay relacin


entre la altura (X) y el
peso (Y).
El tiempo de estudio dedicado
a un curso (X), esta
relacionado con la calificacin
obtenida (Y).
2
0

Existen formas que nos permiten describir la


relacin entre dos variables cuando estas son
numricas:

EL COEFICIENTE DE CORRELACIN DE
PEARSON

EL MODELO DE REGRESIN LINEAL


SIMPLE

Coeficiente de correlacin lineal de


Pearson r

La coeficiente de correlacin lineal de Pearson de dos variables,


r, nos indica si los puntos tienen una tendencia a colocarse
alineadamente.
r es til para determinar si hay relacin lineal entre dos
variables X e Y.
El signo de r determina si la posible relacin entre 2 variables
es directa o inversa.
Frmula:
S

xy

SxS y

Donde: Sxy: covarianza de X e Y


Sx : desviacin estndar de X
Sy : desviacin estndar de Y

Coeficiente de correlacin lineal


de Pearson
Propiedades:
Es adimensional, no tiene unidad fsica que lo defina.
Slo toma valores en [-1,1]
Las variables son incorrelacionadas: r = 0
Relacin lineal perfecta entre dos variables:
r = +1 r = -1
Cuanto ms cerca est r de +1 -1 mejor ser el grado
de relacin lineal.

Interpretacin del Coeficiente de


correlacin de Pearson
Fuerte Moderada
Inversa Inversa
-1 -0,9
Perfecta
Inversa

-0,5

Dbil
Inversa

Moderada Fuerte
Directa Directa

Dbil
Directa
0
No existe
correlacin

0,5

0,9

1
Perfecta
Directa

Coeficiente de correlacin lineal


de Pearson
Correlaciones positivas

Coeficiente de correlacin lineal


de Pearson
Correlaciones negativas

Ejemplo 01:
Con la finalidad de determinar si la
cantidad de horas invertidas en
estudiar est relacionado con las
calificaciones obtenidas, un profesor
tom una muestra de 10 estudiantes
y registr el tiempo (en horas) por
da que dedica cada alumno al
estudio y la calificacin obtenida al
final de ao. Los datos se muestran a
continuacin:

Tiempo
3
1.5
2
2
1.4
4
4.5
5
3
2.5

Notas
15
10
10
12
8
17
19
19
14
12

a. Construya el diagrama de dispersin, que le muestra


el grfico?
b. Calcule el coeficiente de correlacin de Pearson:

a.- Diagrama de dispersin


CALIFICACION/HORAS
21
19
17
15
13
11
9
7
5
1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

5.0

5.5

b.- Coeficiente:
r

S xy
SxS y

4.27
0.879
3.86 *1.26

Interpretacin:
Existe una correlacin moderada entre las calificaciones y
las horas dedicadas al estudio, y esta es directa.

Covarianza de dos variables

La covarianza entre dos variables, Sxy, nos indica si la


posible relacin entre dos variables es directa o inversa.
Directa: Sxy >0
Inversa: Sxy <0
Incorrelacionadas: Sxy =0

1
S xy ( xi x )( yi y )
n i

El signo de la covarianza nos dice si el aspecto de la nube


de puntos es creciente o no, pero no nos dice nada sobre el
grado de relacin entre las variables.

REGRESION
El propsito del anlisis de regresin es usar los datos o valores
observados de las variables, para realizar estimaciones, en base
a una relacin funcional. El anlisis de regresin sirve para
predecir una medida en funcin de otra medida (o varias).
Y

Y = Variable dependiente
predicha
explicada
X = Variable independiente
predictora
explicativa

Y = f(X) + error
f es una funcin de un tipo determinado
el error es aleatorio, pequeo, y no depende de X

Es posible descubrir una relacin?


En el modelo de regresin lineal simple, buscamos
encontrar una funcin de X muy simple (lineal) que nos
permita aproximar Y mediante:
= b0 + b1X
b1 (pendiente de la recta)

SY
b1 r
SX
b0 (ordenada en el origen, constante)

b0 y b1 x

Ejemplo:
Tomamos los datos del ejemplo nmero 01, y obtenemos
los coeficientes:
b1 (pendiente de la recta)

SY
3.86
b1 r
0.879 *
2.706
SX
1.26
b0 (ordenada en el origen, constante)

b0 y b1 x 13.6 2.706 * 2.89 5.78

Solucin
Por lo tanto la recta de regresin = b0 + b1X, estar
determinada de la siguiente manera:
= 5.78 2.706X
Interpretacin:
b0= 5.78 (En promedio un alumno desaprueba cuando no
dedica tiempo al estudio X=0)
b1= 2.71 (En promedio una persona gana 2.71 puntos por
cada hora dedicada)

Ejemplo 02:
Un trabajo estadstico asignado a un
grupo de estudios consiste en
obtener un modelo de regresin
lineal a nivel descriptivo para
predecir las ventas semanales de un
producto especifico en funcin de la
publicidad del producto por la radio.
Para esto han recopilado al azar los
tiempos de duracin en minutos de
la publicidad de 10 semanas y el
respectivo
numero
unidades
vendidas del producto. Los datos se
dan en la tabla que sigue:

Publicidad Ventas
20
50
30
73
30
69
40
87
50
108
60
128
60
135
60
132
70
148
80
140

Ejemplo 02:
Se pide:
a. Graficar los datos y describa su tendencia
b. Obtenga la recta de regresin lineal simple
c. Calcule r
d. Si se da 100 minutos de propaganda, cuanto ser la
venta de una semana?
e. Segn la regresin obtenida, si la publicidad de una
semana cualquiera se incrementa en 5 minutos, Cunto
sera el incremento promedio de las ventas?

Ejemplo 03:

HOP SCOTH AIRLINES


Modelar el nmero
de pasajeros

Ejemplo 03:

Mes

Pasajeros
(miles)
Y

Publicidad
(miles $)
X

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

15
17
13
23
16
21
14
20
24
17
16
18
23
15
16

10
12
8
17
10
15
10
14
19
10
11
13
16
10
12

Ejemplo 04:
CONSUMO
COMPLEMENTO
NUTRICIONAL
1
1,5
2
2,5
3
3,5
4
4,5
5
5,5

VARIACION DE
PESO
8
10
9
12
14
13
15
17
14
14

Prueba de Significancia del


Modelo
Es el modelo significativo?, X influye en Y?
H o : 1 0
H1 : 1 0

Anlisis de Varianza.

Donde:

SCR b1 SPXY
SCE SCT SCR
SCT SCY

Suma de Cuadrados y Productos

SCX x nx
2

SCY y ny
2

2
2

SPXY xy nyx

Coeficiente de Determinacin

Mide el porcentaje de variacin de la variable Y


(dependiente)
explicado
por
X
(variable
independiente).
0 < R 2< 1

SC
Re g
SCR
R
SCT
SCT
2

Error estndar de la estimacin:


Se

CME

Error estndar de los coeficientes:


CMCME
(Residual )
Sb1 S
1
SC
(X )
SCX
1 1 x 2x 2
CME

Sb0 S CM
Re sidual

0
SCX
n nSCX

Intervalo de confianza para los


coeficientes
Intervalos de confianza para

b00 t( n 2,1 / 2) S

Intervalos de confianza para

b11 t( n 2,1 / 2) S

Intervalo de confianza para la


Estimacin Media de Y dado
X=x0
IC ( Y / X O ) :

b0 b1 x0 t( n 2,1 2) S e

1 ( xo x)

n
SCX

Intervalo de Prediccin para


X=x0
IC ( Y / X O ) :

1 ( xo x)
b0 b1 x0 t( n 2,1 2) S e 1
n
SCX

Prueba para el coeficiente de


Regresin
H 0 : 0 0
H1 : 0 0

t0

0 0
S 0

tn2

Prueba para el coeficiente de


Regresin
H 0 : 1 0
H 1 : 1 0

t0

1 1
S 1

tn2

Si 1 0 , es equivalente a probar la significancia


del modelo

Del Ejemplo 04:


Se pide:
a. Obtener la recta de regresin lineal simple
b. Realizar el anlisis de varianza
c. Hallar el intervalo de confianza para Y/Xo=5.3
d. Hallar el intervalo de confianza para Xo
e. Hallar los intervalos de confianza para b0 y b1
f. Determinar la significancia del modelo

S-ar putea să vă placă și