Documente Academic
Documente Profesional
Documente Cultură
A. Objetivos.
Conocer los diferentes tipos de pronsticos que se pueden aplicar en la
formulacin de proyectos de inversin publica.
Calcular ecuaciones de regresin.
Encontrar el coeficiente de correlacin y determinacin entre dos series de
datos.
B. Marco Terico
1. Correlacin
La correlacin es el mtodo es el mtodo empleado para determinar el grado de
relacionamiento entre las variables que se estudian, para as determinar en que
medida una relacin funcional describe o explica de una forma adecuada la
relacin entre estas dos variables Se usa el trmino correlacin cuando se habla
de relaciones entre variables de experimentos bivariantes.
Los diversos tipos de correlacin que existen pueden ser:
r=
((X-X)(Y-Y)) r=
nXY ( X )( Y )
(n-1) SXSY ( nX 2 ( X )2 )( nY 2 ( Y )2 )
2.1 Propiedades
r est siempre comprendido entre -1 y 1.
Si r = 1 r = -1 entonces los puntos de la muestra estn situados en lnea
recta (correlacin lineal perfecta).
Si r est prximo a 1 a -1, habr una asociacin lineal fuerte entre
ambas variables.
Si r es cercano a 0, habr una asociacin lineal muy dbil.
r no vara cuando en las variables se realiza un cambio de escala o de
origen. Esto demuestra que r no tiene dimensin
3. Coeficiente de determinacin
El coeficiente de determinacin se calcula elevando al cuadrado el coeficiente de
correlacin y representa el porcentaje de la variacin explicada por la recta de
regresin. El coeficiente de determinacin r2, es una medida de la proximidad del
ajuste de la recta de regresin; cuanto mayor sea el valor de r2, mejor ser el
ajuste y mas til la recta de regresin como instrumento de prediccin. (r2 = 0.92
indica que de 100 pares de puntos 92 estn en la recta de regresin y 8 fueran de
la recta de regresin)
Y* = a + bX
Donde:
y bx nxy xy
a= b=
n nx 2 ( x )2
Docente: Ing. Ferly Urday Luna Pgina 2 de 22
5. Varianza de la regresin poblacional 2.
Una vez que se ha determinado la recta de regresin Y = a + bX es de suma
prioridad saber su utilidad, siendo esta la de predecir valores de Y para valores
determinados de X. Si se hace una prediccin seria razonable conocer la
respuesta de la interrogante: Qu tan confiable es la prediccin que se acaba de
determinar?
La respuesta a la pregunta anterior depende de la variabilidad de los valores de Y
con respecto a la recta de regresin.
Una medida que indica el grado de variabilidad o dispersin o concentracin en
torno a la lnea de regresin es la varianza de la regresin poblacional, que se
denota por 2 o por Y2 y se define por:
X
N 2
( yi Y ) Donde N es el tamao
(
2 = E Y Y
X
) = i =1
N
X
de la poblacin
SCE ( yi $y i ) yi2 a yi b xi yi
s2 = = i =1
= i =1 i =1 i =1
n2 n2 n2
Donde, el numerador es la suma de los cuadrados de los errores alrededor de la
lnea de regresin y el denominador, n-2, representa los grados de libertad (se le
quitan 2 valores a n porque corresponden al numero de coeficientes de regresin).
1 (x0 -x)2
y0 t 0 s +
n (xi -x)2
C. Aplicaciones
Problema Nro 1
Lori Franz, supervisora de mantenimiento de Baltimore Transit Authority, quisiera
determinar si existe una relacin positiva entre los costos anuales de mantenimiento
de un autobs y su edad. Si existe tal relacin, Lori cree que puede hacer un mejor
trabajo si pronostica el presupuesto anual para el autobs. Ella recopil los datos d la
tabla P.1
a) Grafique un diagrama de dispersin.
b) Qu clase de relacin existe entre estas dos variables?
c) Calcule el coeficiente de correlacin.
d) Determine la recta de mnimos cuadrados.
e) Pruebe la significancia de la pendiente de la regresin en el nivel de significancia
0.05. Esta regresin es significativa? Explique.
f) Pronostique el costo anual del mantenimiento de un autobs de 5 aos.
Tabla Nro 1
Autobus Costo de mantenimiento ($) Edad (aos)
Y X
1 859 8
2 682 5
3 471 3
4 708 9
5 1094 11
6 224 2
7 320 1
8 651 8
9 1049 12
Fuente: Dpto Mnto de Baltimore Transit Authority
Solucin
Punto (a), primero solucionaremos con el Excel.
Paso 1.- Se introducen los datos en una hoja de clculo, y se seleccionan los
valores a graficar, para nuestro caso es el rango C3:D11.
Se escoge el tipo de
grafico.
Luego se puede cambiar
el subtipo
Finalmente se presiona
siguiente
1200
1000 En el presente
Costo de Mantenimiento
diagrama se puede
800 notar que parece
existir cierta relacin
600
lineal, directamente
400 proporcional, entre
las variables tiempo
200
de vida y costo de
0 mantenimiento
0 3 6 9 12 15
Tiem po de vida
nXY ( X )( Y )
r=
2 2 2 2 r=
((X-X)(Y-Y))
( nX ( X ) )( nY ( Y ) ) (n-1) SXSY
948665-596058 8951.44
r= =0.9377 r= =0.9377
(9513-(59) )(94799724-(6058) )
2 2 (9-1)3.9721300.42
FUNCIN: COEF.DE.CORREL
Devuelve el coeficiente de correlacin entre dos rangos de celdas definidos por los
argumentos matriz1 y matriz2. Use el coeficiente de correlacin para determinar la
relacin entre dos propiedades. Por ejemplo, para examinar la relacin entre la
temperatura promedio de una localidad y el uso de aire acondicionado.
Sintaxis
COEF.DE.CORREL(matriz1;matriz2)
Matriz1 es un rango de celdas de valores.
Matriz2 es un segundo rango de celdas de valores.
y bx nxy xy
a= b=
n nx 2 ( x )2
En Excel se hace uso de las funciones:
FUNCIN: INTERSECCION.EJE
Calcula el punto en el que una lnea intersecar el eje y utilizando los valores X e Y
existentes. El punto de interseccin se basa en el mejor ajuste de la lnea de regresin
trazado con los valores X y los valores Y. Utilice la funcin INTERSECCION.EJE para
determinar el valor de la variable dependiente cuando la variable independiente es
igual a 0 (cero). Por ejemplo, puede emplear la funcin INTERSECCION.EJE para
predecir la resistencia elctrica de un metal a 0 C si los puntos de datos se han
tomado a temperatura ambiente o superior.
Sintaxis
INTERSECCION.EJE(conocido_y;conocido_x)
Conocido_y es el conjunto de observaciones o datos dependientes.
Conocido_x es el conjunto de observaciones o datos independientes.
Otra forma de encontrar dicha recta es por el mtodo grafico en el Excel, para ello se
hace clic derecho en cualquier punto del diagrama de dispersin y se escoge agregar
lnea de tendencia.
Diagrama de dispersin y = 70.918x + 208.2
2
R = 0.8792
1200
1000
Costo de Mantenimiento
800
600
400
200
0
0 3 6 9 12 15
Tiem po de vida
Para realizar este anlisis en Excel, se activa men herramientas Anlisis de datos y
se escoge regresin:
Resumen
Estadsticas de la regresin
Coeficiente de
correlacin mltiple 0.93767326
Coeficiente de
determinacin R^2 0.87923114
R^2 ajustado 0.86197845
Error tpico 111.60975
Observaciones 9
ANLISIS DE
VARIANZA
Grados de Suma de Promedio de Valor crt
F
libertad cuadrados cuadrados de F
Regresin 1 634819.73 634819.73 50.96196 0.0001871
Residuos 7 87197.15 12456.73
722016.888
Total 8 9
Donde:
SCE ( y $y )
i i y 2
i a yi b xi yi
s2 = = i =1
= i =1 i =1 i =1
n2 n2 n2
2
n X Y Yi (Y-Yi)
1 8 859 775.5484155 6964.166957
2 5 682 562.7940141 14210.06708
3 3 471 420.9577465 2504.227137
4 9 708 846.4665493 19172.98527
5 11 1094 988.3028169 11171.89451
6 2 224 350.0396127 15885.98396
7 1 320 279.1214789 1671.05349
8 8 651 775.5484155 15512.3078
9 12 1049 1059.220951 104.4678333
59 6058 87197.15405
87197.15
s== 111.61
92
El coeficiente de determinacin se puede calcular con la relacin:
2 12456.74
R =1- =0.861978
90252.11
Los coeficientes de la recta de regresin son:
Coeficientes
Intercepcin 208.203
Variable X 1 70.918
Y*=Y=Y=209.203+70.918X
i
X 2
( X i )
i
n
X = 59
2
X = 513
n= 9
sx = 9.934230312
b1
t=
sb1
70.918
t= = 7.139
p= 0.000187190 9.934
Y* = 209.203 + 70.918(5)
Y* = 562.794
Ao Gasto
1995 14.8
1996 20.6
1997 22.1
1998 19.3
1999 20.6
2000 25.6
2001 26.5
2002 28.5
2003 26.8
2004 28.7
2005 35.1
2006 37.0
2007 30.5
FUENTE.- Dpto de RRHH - enero del 2008
Problema Nro 3
Encontrar la ecuacin de tendencia para los siguientes datos: (Utilizar un modelo lineal
o uno que se pueda linealizar)
2 2
1.5 1.5
1 1
0.5 1 0.5 2
0 0
0 1 2 3 4 5 6 0 1 2 3 4 5 6
y = -1.0456Ln(x) + 2.9566
y = 3.0498e-0.1728x
R2 = 0.71 3
3 R2 = 0.5443
2.5
2.5
2
2
1.5
1.5
1
1
0.5
0.5
3 4
0
0
0 1 2 3 4 5 6
0 1 2 3 4 5 6
Problema Nro 4
Solucin
Se utiliza la opcin agregar lnea de tendencia de Excel, con un modelo polinomial de
grado 2 (Parbola de mnimos cuadrados)
2
y = -0.211x + 2.0649x + 2.5878
10 2
R = 0.9823
8
0
0 2 4 6 8 10 12
Problema Nro 5
Aplicacin de series de tiempo con varios valores por ao, uso del ndice estacional
ajustado para pronosticar
Solucin
Para dar solucin a este problema se deben seguir los siguientes pasos:
Re al
%Valor Re al = 100
Pr omedio Movil
600
500
400
300
200
100
0
0 5 10 15 20 25
f) En el paso Nro 5, reunir todos los porcentajes reales con respecto a los valores
promedio mvil que se encuentran en la columna 7 de la tabla Nro 3 y organizarlos
por trimestres, ver tabla Nro 4
Una vez reunidos los porcentajes de valores reales se proceder a calcular la media
modificada. Los valores estacionales que se han recuperado para los trimestres,
todava contienen las componentes cclica e irregular de la variacin de la serie
temporal. Al eliminar los valores mas alto y mas bajo de cada trimestre, se reducen
estas variaciones cclicas e irregulares extremas.
Trimestre I II III IV
Media Modificada 88.93%143.38%104.00% 63.19%
Por ejemplo, el valor 88.93, es el resultado de promediar 90.16 con 87.70, los valores
85.35 y 96.34 han sido eliminados para el primer trimestre. Repetir este proceso para
los dems trimestres.
Constante de
estacionalidad 1.001251564
21 I 368.34 327.97
22 II 373.12 535.66
2007
23 III 377.91 393.51
24 IV 382.69 242.13
25 I 387.47 345.01
26 II 392.26 563.12
2008
27 III 397.04 413.44
28 IV 401.82 254.23
29 I 406.61 362.04
30 II 411.39 590.59
2009
31 III 416.17 433.36
32 IV 420.96 266.34
600
500
400
300
200
100
0
0 5 10 15 20 25
Nro Vendedores 2 6 8 8 12 16 20 20
Ventas Mensuales
58 105 88 118 117 137 157 169
Miles de $
4. La siguiente semana. Stan se dirigi a Laurel para pedirle algunos datos para su
prxima reunin sobre ventas.