Sunteți pe pagina 1din 22

SOLUCIN DE PRCTICA DE CORRELACIN Y REGRESIN LINEAL

1. Desarrollo:
X: consumo anual de vino (litros por habitante).
Y: N de muertes por enfermedad cardiaca, por cada 100000 hab.
Vamos a trabajar con la siguiente tabla:

Qu podemos decir sobre la relacin entre las dos variables? Encuentra la


correlacin de Pearson.
Para calcular la relacin de Pearson debemos trabajar con la siguiente tabla:

Para calcular la correlacin de Pearson:

r=

xy
x. y

Dnde:

xy :

Es la covarianza.

x : Es la varianza de la variable X.
y : Es la varianza de la variable Y.

Clculo de la varianza de X:

x=

X 2 X 2
n

X = 57.5 =3.0263
X =
n
19

Pues como son datos que no estn agrupados, entonces la frecuencia fi =


1, para cada uno de los valores de X.
Reemplazando:

x=

287.39
3.02632 =2.4428
19

Clculo de la varianza de Y:
De manera anloga al clculo de la varianza en X.

y=

Y 2 Y 2
n

Y = 3630 =191.0526
Y =
n
19

Pues como son datos que no estn agrupados, entonces la frecuencia fi =


1, para cada uno de los valores de Y.
Reemplazando:

y=

777726
191.05262=66.5722
19

Clculo de Covarianza:

xy =

X . Y X . Y

xy =

8381.4
3.0263 (191.0526)
19

xy =

8381.4
3.0263 ( 191.0526 ) =137.0562
19

Finalmente ya podemos reemplazar estos resultados en la frmula de coeficiente


relacin de Pearson:

r=

137.0562
2.4428(66.5722)

r=0.8428

Podemos hacer el siguiente anlisis en base al resultado obtenido:

Como el coeficiente de correlacin de Pearson result ser un valor


negativo, podemos decir que la relacin entre las variables X y Y es
inversa, es decir a mayor consumo de vino (X) menor nmero de muertos
por enfermedades cardiacas (Y).

Como el r tiende a -1, podemos decir que es una relacin fuerte, es decir
los puntos definidos por (X, Y) estn bien cercanas a la recta generada por
la regresin lineal.

Podemos afirmar que a mayor consumo de vino menor nmero de muertes por
enfermedad cardiaca? Realiza la nube de puntos y determina la ecuacin de
regresin lineal.
Grfico de dispersin de puntos:

Para la regresin lineal nosotros utilizaremos la ecuacin general de una recta:

y ' =a+ b . x

Dnde:

n ( X 2 )
n . ( X . Y ) X . Y
b=

a=

Y b . X
n

Clculo de b:

b=

19(8381.4)57.5(3630)
2
19 ( 287.39 ) (57.5)

b=22.9688

Clculo de a:

a=

3630+22.9688 (57.5)
19

a=260.5635

Finalmente:

y ' =260.563522.9688 x

Obtenindose el siguiente grfico:

Podemos predecir aproximadamente el valor de la variable Y si sabemos el valor


de X? Estima el N de muertes por enfermedad cardiaca en Rusia para un promedio
de consumo anual de vino de 1.8 litros por habitante.

Aplicamos la ecuacin obtenida:

y ' =260.563522.9688 x
y ' =260.563522.9688 (1.8)
y ' =219.2197

muertes
100000 hab .

2. Desarrollo:
Para el siguiente ejercicio se trabajara con las variables:
X: horas trabajadas.
Y: unidades producidas.
Con los siguientes datos:

Para hacer los clculos respectivos debemos trabajar con la siguiente tabla:

Factor de Correlacin de Pearson:

r=

xy
x. y

Dnde:

xy :

Es la covarianza.

x : Es la varianza de la variable X.
y : Es la varianza de la variable Y.

Clculo de la varianza de X:

x=

X 2 X 2
n

X = 936 =78
X =
n
12

Pues como son datos que no estn agrupados, entonces la frecuencia fi =


1, para cada uno de los valores de X.
Reemplazando:

x=

73760
78 2=7.9162
12

Clculo de la varianza de Y:

De manera anloga al clculo de la varianza en X.

y=

Y 2 Y 2
n

Y = 3632 =302.6667
Y =
n
12

Pues como son datos que no estn agrupados, entonces la frecuencia fi =


1, para cada uno de los valores de Y.
Reemplazando:

y=

1109254
302.66672=28.8219
12

Clculo de Covarianza:

xy =

xy =

X . Y X . Y
n

285908
78(302.6667)
12

xy =217.6641

Finalmente ya podemos reemplazar estos resultados en la frmula de coeficiente


relacin de Pearson:

r=

217.6641
7.9162(28.8219)

r=0.9540

Podemos hacer el siguiente anlisis en base al resultado obtenido:

Como el coeficiente de correlacin de Pearson result ser un valor positivo,


podemos decir que la relacin entre las variables X y Y es directa, es decir
a mayor horas de trabajo (X) mayor nmero de unidades producidas (Y).

Como el r tiende a 1, podemos decir que es una relacin fuerte, es decir los
puntos definidos por (X, Y) estn bien cercanas a la recta generada por la
regresin lineal.

Grfico de dispersin de puntos:

Para la regresin lineal nosotros utilizaremos la ecuacin general de una recta:

y ' =a+ b . x

Dnde:

n ( X 2 )
n . ( X . Y ) X . Y
b=

a=

Y b . X
n

Clculo de b:

b=

12(285908)936(3632)
2
12 ( 73760 )(936)

b=3.4734

Clculo de a:

a=

36323.4734(936)
12

a=31.7415

Finalmente:

y ' =31.7415+3.4734 x

Obtenindose el siguiente grfico:

3. Desarrollo:
Para el siguiente ejercicio se trabajara con las variables:
X: Gastos semanales en publicidad.
Y: Ventas Semanales.
Con los siguientes datos:

Para hacer los clculos respectivos debemos trabajar con la siguiente tabla:

Factor de Correlacin de Pearson:

r=

xy
x. y

Dnde:

xy :

Es la covarianza.

x : Es la varianza de la variable X.
y : Es la varianza de la variable Y.

Clculo de la varianza de X:

x=

X 2 X 2
n

X = 564 =56.4
X =
n
10

Pues como son datos que no estn agrupados, entonces la frecuencia fi =


1, para cada uno de los valores de X.
Reemplazando:

x=

32604
56.42=8.9129
10

Clculo de la varianza de Y:
De manera anloga al clculo de la varianza en X.

y=

Y 2 Y 2
n

Y = 14365 =1436.5
Y =
n
10

Pues como son datos que no estn agrupados, entonces la frecuencia fi =


1, para cada uno de los valores de Y.

Reemplazando:

y=

20763875
1436.52=113.3810
10

Clculo de Covarianza:

xy =

X . Y X . Y
n

xy =

818755
56.4 (1436.5)
10

xy =856.9

Finalmente ya podemos reemplazar estos resultados en la frmula de coeficiente


relacin de Pearson:

r=

856.9
8.9129(113.3810)

r=0.8480

Podemos hacer el siguiente anlisis en base al resultado obtenido:

Como el coeficiente de correlacin de Pearson result ser un valor positivo,


podemos decir que la relacin entre las variables X y Y es directa, es decir
a mayores gastos semanales en publicidad (X) mayores ventas semanales
(Y).

Como el r tiende a 1, podemos decir que es una relacin fuerte, es decir los
puntos definidos por (X, Y) estn bien cercanas a la recta generada por la
regresin lineal.

Grfico de dispersin de puntos:

Para la regresin lineal nosotros utilizaremos la ecuacin general de una recta:

'

y =a+ b . x

Dnde:

n ( X 2 )
n . ( X . Y ) X . Y
b=

a=

Y b . X
n

Clculo de b:

b=

10(818755)564(14365)
10 ( 32604 ) (564)2

b=10.7868

Clculo de a:

a=

1436510.7868(564)
10

a=828.1245

Finalmente:

y ' =828.1245+10.7868 x

La pendiente b = 10.7868, significa la razn de cambio entre las ventas semanales


y los gastos semanales por publicidad.
Obtenindose el siguiente grfico:

Con estos datos podemos hacer los pronsticos:


Para el valor de 50 dlares en gastos semanales de publicidad:

y ' =828.1245+10.7868 ( 50 ) dlares

'

y =1367.4645 dlares

Para el valor de 60 dlares en gastos semanales de publicidad:

y ' =828.1245+10.7868 ( 6 0 ) dlares

'

y =1475.3325 dlares

Los errores de aproximacin:


Para el valor de 61 dlares en gastos semanales de publicidad:

y ' =828.1245+10.7868 ( 6 1 ) dlares


'

y =1486.1193 dlares
Y =1 510 dlares

error=15101486.1193=23.8807 dlares

Para el valor de 62 dlares en gastos semanales de publicidad:


'

y =828.1245+10.7868 ( 6 2 ) dlares
y ' =1 496.9061 dlares
Y =1400 dlares

error=14001496.9061=96.8061 dlares

Para el valor de 63 dlares en gastos semanales de publicidad:

y ' =828.1245+10.7868 ( 6 3 ) dlares


y ' =1507.6929 dlares
Y =14 25 dlares

error=14251507.6929=82.6929 dlares

S-ar putea să vă placă și