Sunteți pe pagina 1din 35

ANALISIS DE

REGRESION Y
CORRELACION
o SESION N 7

1
Introduccin
o El vicepresidente de una gran
compaa opina que las
ganancias anuales de la empresa
dependen de la cantidad gastada
en investigacin y desarrollo. El
presidente de la compaa no
est de acuerdo y ha solicitado
o Qu herramienta puede presentar el
vicepresidente que sustenten su teora?
o Qu variables tendr que medir?
o Qu ecuacin ayudar a predecir las
ganancias anuales en funcin de la cantidad
presupuestada en I y D?
o Ser esta ecuacin lineal o no lineal?
o Qu precisin se puede esperar al usar esta
herramienta de toma de decisiones?
A continuacin se presentan datos de 11 aos

Gasto en I y D Ganancia
Ao (ciento de anual
miles ) (millones)
50
1999 2 20 40
2000 4 25 30
20
2001 5 34
10
2002 4 30 0
1 2 3 4 5 6 7 8 9
2003 6 33
2004 5 34
2005 5 36 Una lnea recta podra
2006 7 35 ser lo ms adecuado
2007 8 40 para relacionar estas
2008 7 37 variables?
2009 8 41
ANALISIS DE REGRESION

o El trmino regresin fue utilizada por


primera vez por FRANCIS GALTON
(18221911) en sus estudios biolgicos
sobre la herencia.

o GALTON manifest que: la estatura


de los hijos de padres inusualmente
altos o inusualmente bajos, tienden
a moverse o regresar a la estatura
promedio de la poblacin.
I. DEFINICIN:

o Es una tcnica estadstica que sirve


para analizar la dependencia de
una variable respecto a otra
variable, es decir, conociendo los
valores de una variable
independiente se trata de estimar
los valores de una variable
dependiente.
II. FUNCIONES DEL ANLISIS DE REGRESIN:

Las funciones que persigue el Anlisis de Regresin son:

1. Determinar si las variables independientes y la


variable dependiente presentan fuerzas de relacin.
2. Determinar la estructura o la ecuacin matemtica
que relaciona las variables independientes con las
dependientes.
3. Pronosticar o predecir los valores de la variable
dependiente en funcin de la variable independiente.
4. Controlar otras variables independientes al evaluar
las contribuciones de una variable especifica o un
conjunto de variables
III. TIPOS DE REGRESIN:
IV. DIAGRAMA DE DISPERSIN

o Es el primer paso a realizar para determinar


si existe una relacin entre dos variables.
o Este grafico consiste en un conjunto de
puntos (x, y) presentados en un plano
cartesiano.
o Este diagrama permite visualizar el patrn
de comportamiento de estas variables y por
ende conocer la ecuacin de regresin que
describen dichos datos.
Nubes de Puntos- Dispersin- Esparcimiento

Sea un conjunto de pares de valores de las variables X e Y. Si los


representamos en un diagrama de dispersin obtendremos una nube
de puntos que nos dar una idea grfica de la posible correlacin
entre ambas variables.
Y Y Y

X X X

No hay relacin Relacin positiva Relacin negativa


ALGUNOS CASOS :
Anlisis de Regresin Lineal Simple

Qu es el anlisis
de regresin
lineal ?

Es modelar la dependencia de la variable Y


en funcin de la variable X a travs de la
ecuacin de una recta.

Yi 0 1 X i ei i=1, 2, , n

Error ~ NID(0, 2)
Parmetros Variable
Variable
predictora
dependiente
(independiente)
V. ECUACION DE
REGRESIN
Si la variable respuesta o variable dependiente (Y) est en relacin con

la variable independiente (X), entonces la relacin funcional o ecuacin

de regresin entre Y y X tienen la siguiente forma:

Y 0 1 X Ecuacin de regresin poblacional

Y 0 1 X Ecuacin de regresin muestral

Donde:

Y = Variable dependiente X= Variable independiente


0
1 = Parmetros de la ecuacin
CMO SE INTERPRETAN LOS PARMETROS

Se interpretan como:

0 es el valor estimado de la variable Y cuando la


variable X = 0

1 es el coeficiente de regresin que est expresado en


las mismas unidades de Y por cada unidad de X.

Indica el nmero de unidades en que vara Y cuando se


produce un cambio en una unidad en X.
VI. ESTIMACIN DE LOS
COEFICIENTES DE
o REGRESIN
Para estimar los coeficientes de la ecuacin
de regresin, se utiliza el Mtodo de los
Mnimos Cuadrados Ordinarios (MMCO).

o Este Mtodo trata de encontrar las


coeficientes de la ecuacin que ms se
aproxime al conjunto de datos, es decir,
encuentra la ecuacin de la recta de tal
manera que los errores que se forman sean
los ms pequeos posibles.
o Para estimar estos coeficientes de regresin ,
primeramente se deben construir las ecuaciones
normales que son las siguientes:

n n

Y
i 1
n 0 1 X
i 1

n n n

YX 0 X 1 X
2

i 1 i 1 i 1
o Al resolver este sistema de ecuaciones
normales obtenemos las siguientes formulas :

_ _

1 XY n X Y 0 y 1 x
_

X nX
2 2

o Luego se sustituyen los valores en la ecuacin


de la recta para obtener la ecuacin estimada
o predicha por el MMCO.
ERROR ESTNDAR DE LA ESTIMACIN

o El error estndar de la estimacin mide la


cantidad estndar en la cual los valores reales de
Y difieren de los valores estimados .
o Para su clculo se utiliza la siguiente frmula:

n n n

Y
2
0 Y 1 XY
S y.x i 1 i 1 i 1
n2
ANALISIS DE CORRELACIN
o El anlisis de correlacin es una
tcnica estadstica que mide el
grado de asociacin o afinidad
entre las variables cuantitativas
consideradas en un estudio.
o Se llamar CORRELACION SIMPLE
cuando se trata de analizar la relacin
entre dos variables. Se llamar
CORRELACION LINEAL O RECTILINEA si la
funcin es una recta, y de CORRELACION
NO LINEAL cuando la funcin es una
curva o una funcin de grado superior.
El COEFICIENTE DE CORRELACION DE
PEARSON
Es el estadgrafo que mide el grado de asociacin
o afinidad entre las variables cuantitativas y se
denota por r la cual se define como:

n n n
n XY X Y
r n
i 1
n
i 1
n
i 1
n
n X 2 ( X ) 2 n Y 2 ( Y ) 2
i 1 i 1 i 1 i 1
Interpretacin:

-1 -0.7 -0.4 0 0.4


0.7 +1
Perfecta
Perfecta

Alta Regular Baja Baja Regular


Alta

NEGATIVA POSI
TIVA
COEFICIENTE DE DETERMINACIN
o El coeficiente de determinacin mide el
porcentaje de variabilidad en Y que puede
ser explicada por la variable
independiente X.
o Se denota por R2 o r2

0 Y 1 XY nY
2

r
2

Y
2
2
nY
INTERPRETACION:

o Si r2 0.70, la ecuacin
estimada se ajusta o tiende a
representar los datos.

o Si r2 = 1, la ecuacin estimada
es perfecta.
EJEMPLO 1:

Se tienen informacin de los costos de mantenimiento


de 06 maquinas llenadotas de gaseosas de distintas
edades de la Empresa Enrique Cassinelli e Hijos S.A.
La Gerencia desea hacer estimaciones o pronsticos
acerca del costo de mantenimiento (Y) en funcin del
tiempo operativo de la mquina (X). La informacin
que se tienen es la siguiente:
1. Determinar la ecuacin de regresin. Interpretar
sus coeficientes
2. Pronosticar el costo de mantenimiento para una
mquina que tienen 4 aos operativos.
3. Hallar el error estndar de estimacin.
SOLUCIN
GRAFICAR PARA CONOCER LA TENDENCIA DE
DATOS
120

Diagrama de Dispersion
100
f(x) = 32.5x + 5
R = 0.96
80

Costo 60
de mantenimiento $

40

20

0
0.5 1 1.5 2 2.5 3 3.5

Tempo operativo en aos


1.- Determinacin de la Ecuacin de Regresin:
Calculando los coeficientes de regresin:

n n n
n XY X Y
6(970) (12)( 420)
1 i 1 i 1 i 1
32.5
n
n X ( X )
2
n
2 6(28) (12) 2

i 1 i 1

0 y 1 x = 70 (32.5 (2)) = 5
Por lo tanto la ecuacin de regresin es:

Y = 5 + 32.5 X
Interpretacin:
o 0 = 5: Cuando la mquina no tienen
ningn ao de funcionamiento su costo de
mantenimiento es de 5 dlares.
o 1 = 32.5: Por cada ao de
funcionamiento de la maquina su costo de
mantenimiento aumenta en 32.5 dlares.
2 . Pronostico cuando la mquina
tienen 4 aos de
funcionamiento:

Y=5+32.5x4=135, que significa,


que el costo de mantenimiento
para la maquina si tiene 4 aos
de funcionamiento es de 135$.
GRAFICAR PARA CONOCER LA TENDENCIA DE
120 DATOS
Diagrama de Dispersion
100
f(x) = 32.5x + 5
R = 0.96
80

Costo 60
de mantenimiento $

40

20

0
0.5 1 1.5 2 2.5 3 3.5

Tempo operativo en aos


EJEMPLO 2:
El dueo de una licorera est interesado en medir el efecto del
precio de las botellas de whisky escocs sobre la cantidad vendida.
Los resultados de la tabla adjunta se obtuvieron de una muestra
aleatoria de las ventas de ocho semanas. El precio est medido en
dlares y las ventas en cajas:

PRECIO 192 205 197 213 208 199 178 172


VENTAS 25 14 18 12 11 15 29 35

A. Estimar la recta de regresin


para las ventas.
B. Estimar cunto ser la cantidad
vendida si el precio de la caja es
de 200 dlares.
Resolviendo:

Precio Ventas XY X2
192 25
205 14
197 18
213 12
208 11
199 15
178 29
172 35
Totales
Reemplazando los valores tenemos:
n8
_
X 1564 / 8 195.5
_
Y 159 / 8 19.875
_ _

b
XY n X Y 30227 8 195.5 19.875
0.5963
_
307200 8 195.5 2

X n X
2 2

_ _
a Y b X 19.875 (0.5963) 195.5 136.4545

Y 136.4545 0.5963x

Por cada dlar que incrementa el precio de la botella de


whisky las ventas disminuye en 0.5963 cajas.

S-ar putea să vă placă și