Documente Academic
Documente Profesional
Documente Cultură
REGRESIN
SIMPLE LINEAL SIMPLE
Es cuando una variable independiente ejerce influencia sobre otra variable dependiente.
COEFICIENTE DE
CORRELACIN, R
El coeficiente de correlacin ( r ) es una
medida de la intensidad de la relacin entre
dos variables.
Requiere datos con escala de intervalo o de
razn (variables).
Puede tomar valores entre -1.00 y 1.00.
Valores de -1.00 o 1.00 indican correlacin
fuerte y perfecta.
Valores cercanos a 0.0 indican correlacin
dbil.
Valores negativos indican una relacin
NUBEinversa
DE PUNTOS
O DIAGRAMA
DISPERSIN.
y valores
positivosDE
indican
una
relacin directa.
Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor
posible, llamada recta de regresin.
Reglaparalainterpretaciondelvalordelcoeficientedecorrelacion"r":
r=0
la correlacin es nula.
r<0a0.20>
la correlacin es positiva pero casi nula
r<-0.20a0>
la correlacin es negativa (inversa) pero casi nula
r<0.20a0.40>
la correlacin es positiva y baja
r<-0.20a-0.40>
la correlacin es negativa (inversa) y baja
r<0.40a0.70>
la correlacin es positiva y buena o significativa
r<-0.40a-0.70>
la correlacin es negativa (inversa) y buena o significativa
r<0.70a1>
la correlacin es positiva y muy buena o muy significativa
r<-0.70a-1>
la correlacin es negativa (inversa) y muy buena o muy significativa
r=1
la correlacin es perfecta positiva
r=-1
la correlacin es perfecta y negativa(inversa)
Correlacin directa
La recta correspondiente a la nube
del puntos de la distribucin es una
recta creciente.
Correlacin inversa
La recta correspondiente a la de la
distribucin
es
una
recta
decreciente.
Correlacin nula
En este caso se dice que las
variables son encorraladas y la
nube de puntos tiene una forma
redondeada.
Correlacin no lineal
n: numero de la muestra
X: total de x
y : total y
a : ordenada de la y en la muestra
b: pendiente de la muestra
Representa
ntes de
ventas
Llamadas
de ventas
(X)
Copiadoras
vendidas
(Y)
XY
CINTHIA
20
30
400
900
600
CAROLINA
40
60
1600
3600
2400
JOSE LUIS
20
40
400
1600
800
CARLOS
30
60
900
3600
1800
MILAGROS
10
30
100
900
300
MALENA
10
40
100
1600
400
BRYAN
20
40
400
1600
800
ANGEL
20
50
400
2500
1000
BEATRIZ
20
30
400
900
600
ANTONIO
30
70
900
4900
2100
TOTAL
220
450
5600
22100
10800
Encontrando b:
Luego a:
b=
a=
b=
a=
b=
a=
b=
a= 18.9476
b= 1.1842
Y = 18.9476 + 1.1842
Y=18.9476+1.1842(X)
Y=18.9476+1.1842(20)
Y=42.6316
valor
b=1.1842 , significa que para cada llamada adicional que realizan los representantes de
ventas pueden esperar aumentar en casi 1.2 el numero de copiadoras vendidas.
El valor
a=18.9476 es el punto donde la ecuacin cruza el eje Y. Una traduccin literal es que si no
se hacen llamadas, esto es, X=0, se vendern 18.9476 copiadoras. Obsrvese que X=0 se
encuentra fuera del intervalo de valores incluidos en la muestra, las llamadas a clientes
fueron de 10 a 40, as que los clculos deben hacerse dentro de esa gama de valores.
ANLISIS DE CORRELACIN
Ejemplo
Juan Escobedo, presidente de la Biblioteca UPAO, se ocupa de estudiar el costo de los libros
de texto para los estudiantes de Arquitectura. l cree que hay una relacin entre el nmero
de pginas en el texto y el precio de venta del libro. Para proporcionar una prueba,
selecciona una muestra de ocho libros de texto actualmente existentes en la librera.
Dibujar un diagrama de dispersin. Comprobar el coeficiente de correlacin.
Libro
Pginas
Precio ($)
500
84
Anlisis estructural
700
75
Arte de proyectar
800
99
600
72
Arquitectura sostenible
400
69
500
81
La cuidad moderna
600
63
800
93
99
93
90
80
75
70
72
69
63
60
350
400
450
500
550
600
Pginas de libros
650
700
750
800
850
Pginas Precio($)
X
Y
XY
X2
Y2
Intr. a la Historia Arq.
500
84 42,000
250,000
7,056
nalisis Estr.
700
75
52,500
490,000
5,625
Arte de Proyectar
800
99
79,200
640,000
9,801
Arq. Forma espacio y orden
600
72
43,200
360,000
5,184
Arq. sostenible
400
69
27,600
160,000
4,761
Arq. e interiores en madera
500
81
40,500
250,000
6,561
La cuidad moderna
600
63
37,800
360,000
3,969
Color, espacio y estilo
800
93
74,400
640,000
8,649
Total
4,900
636
397,200 3,150,000
51,606
n ( X
n(XY ) (X )( Y )
2
) ( X )
n Y Y
2
0.614
El coeficiente de correlacin de 0.614 indica una relacin
muy intensa entre la cantidad de pginas y el precio de
los libros.
Anlisis de regresin
La ecuacin de regresin es: Y' = a + bX, donde:
Y' es el valor pronosticado de la variable Y para un valor seleccionado de X.
a es la ordenada de la interseccin con el eje Y cuando X = 0. Es el valor estimado de Y
cuando X=0
b es la pendiente de la recta, o el cambio promedio en Y' para cada cambio de una unidad
en X.
el principio de mnimos cuadrados se utiliza para obtener a y b.
El principio de mnimos cuadrados se utiliza para obtener a y b. Las
ecuaciones para determinar a y b son:
n ( XY ) ( X )( Y )
n( X 2 ) ( X ) 2
Y
X
a
b
n
n
Ejemplo
Desarrolle una ecuacin de regresin para la informacin dada en el ejemplo anterior que
se puede utilizar para estimar el precio de venta basado en el nmero de pginas.
.05143
636
4,900
0.05143
48 .0
8
8
DIAGRAMA DE DISPERSION:
100
90
f(x) = 0.05x + 48
R = 0.38
80
Precio
Linear (Precio)
70
60
350 400 450 500 550 600 650 700 750 800 850
Pginas de libros
s y. x
(Y Y ) 2
n2
2
Y aY bXY
n2
EN EL EJEMPLO ANTERIOR:
Encuentre el error estndar de estimacin para el
problema que implica el nmero de pginas en un
libro y el precio de venta.
s y.x
aY bXY
n2