Sunteți pe pagina 1din 10

Ing.

Jos Carlos Delgado Chong DETERMINACIN DE RENTAS MEDIANTE ANLISIS DE REGRESIN


Estimacin por mnimos cuadrados para un modelo lineal simple en la obtencin de Rentas Debido a que la regresin es un mtodo de anlisis de los datos que sirve para poner en evidencia las relaciones que existen entre diversas variables. El objeto de un anlisis de regresin es investigar la relacin estadstica que existe entre una variable dependiente (Y) y una o ms variables independientes ( X 1 , X 2 , X 3 , ... ). Para poder realizar esta investigacin, debe postular una relacin funcional entre las variables. Debido a simplicidad analtica, la forma funcional que ms se utiliza en la prctica la relacin lineal. Cuando solo existe una variable independiente, esto reduce a una lnea recta: se su es se

= b +b X Y 0 1
Donde los coeficientes b0 y b1 son parmetros que definen la posicin e inclinacin de la recta. (Ntese el smbolo especial para representar el valor de Y calculado por la recta. Como veremos, el valor real de Y rara vez coincide exactamente con el valor calculado, por lo que es importante hacer esta distincin.) El parmetro b 0, conocido como la ordenada en el origen, nos indica cunto es Y cuando X = 0. El parmetro b1, conocido como la pendiente, nos indica cunto aumenta Y por cada aumento de una unidad en X. Nuestro problema consiste en obtener estimaciones de estos coeficientes a partir de una muestra de observaciones sobre las variables Y y X. En el anlisis de regresin, estas estimaciones se obtienen por medio del mtodo de mnimos cuadrados. Se estudiar la estimacin por mnimos cuadrados para el modelo lineal simple, para la determinacin del valor de la renta o venta de un inmueble, en el que slo se tiene una variable de prediccin, y se supone una ecuacin de regresin lineal, para la obtencin de los resultados, se considerarn como datos, la cantidad de metros cuadrados y el valor de mercado de la propiedad. En el caso de la renta, se considerarn todas las rentas brutas o netas, nunca en combinacin. En el siguiente ejemplo, se considerarn los datos de una plaza comercial, que renta locales de varias dimensiones, teniendo ya investigadas, la renta bruta de cada uno de los locales, as como naturalmente, su medida, para la obtencin del valor de renta por metro cuadrado.

Ing. Jos Carlos Delgado Chong

TABLA1 Datos de la muestra para un modelo lineal simple (superficie del local en m2)

xi
local comercial

yi
renta por local

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

295 320 340 360 320 285 310 285 305 270 275 310 315 295 275

$ 18,500.00 $ 20,000.00 $ 21,100.00 $ 22,400.00 $ 21,200.00 $ 15,000.00 $ 18,000.00 $ 18,800.00 $ 15,700.00 $ 14,400.00 $ 15,500.00 $ 17,200.00 $ 19,000.00 $ 17,200.00 $ 16,800.00

Estimacin por mnimos cuadrados para el modelo lineal simple

Ing. Jos Carlos Delgado Chong

Regresion Lineal
25000 $22,400.00 $21,100.00 20000 $20,000.00 $18,500.00 $18,800.00 $18,000.00 $15,700.00 $19,000.00 $17,200.00 $15,500.00 $17,200.00 $16,800.00 $21,200.00

15000 renta

$15,000.00

$14,400.00

10000

5000

295

320

340

360

320

285

310

285

305

270

275

310

315

295 275

medida de los locales

A pesar de qu e esta grfica muestra una gran dispersin 1, se observa una tendencia lineal. De acuerdo con lo anterior se supondr un modelo de la forma: Yi
=

i Xi +

i = 1, 2, , n,

Ecuacin (1)

Donde Y, e la i-sima observacin de la variable respuesta, la cual corresponde al i-simo valor x, de la variable de prediccin, e, es el error aleatorio no observable asociados con Yi; ; o y 1 son los parmetros desconocidos que representan la interseccin y la pendiente, respectivamente. La ecuacin 1 se conoce como modelo lineal simple, debido a que es lineal en los parmetros y se tiene slo una variable de prediccin. Cada observacin Y i es una variable aleatoria que es la suma de dos componentes; el trmino no aleatorio 0 + 1xi, y la componente aleatoria i. Si i, fuera un valor igual a cero, la observacin Yi se encontrara precisamente sobre la lnea de regresin 0 + 1xi,. Por lo tanto i es la distancia vertical de la observacin a la lnea de regresin. Dado que se supone:
1

Por eso se le conoce como grfica de dispersin.

Ing. Jos Carlos Delgado Chong

E(i) = 0, Var(i) = 2 Y Cov (i, j) = 0 Entonces: E (Yi)= E( 0


+

i = 1, 2 ,3, , n

i j;

iXi +

i) = 0
ij,

i Xi

Cov (Yi, Yj) = 2 Y Var (Yi) = Var ( 0


+

iXi +

i)

= Var(i) = 2

El ultimo resultado surge del hecho de que la varianza de una variable aleatoria no varia con respecto a la localizacin; en este caso, el corrimiento en localizacin est proporcionado por el trmino no aleatorio 0 + 1xi. Por lo tanto, en trminos reales, lo que se supone es que para cada calificacin promedio x existe una distribucin de probabilidad para las rentas cuya media es una funcin lineal de x y cuya varianza es la misma para toda x. El modelo proporcionado en la ecuacin 1 debe considerarse slo como una seleccin inicial para la forma funcional de la curva de regresin. Con base en anlisis ms apropiados, los cuales se examinar ms adelante, puede ser necesario hacer ajustes y stos a su vez pueden dar como resultado una ecuacin final de prediccin diferente de la del modelo inicial. Para obtener los estimadores de mnimos cuadrados de 0 + 1xi, se generalizar un conjunto de datos consistente en n pares (x1, y1), (x2, y2), ., (xn, yn), donde los valores de y son las observaciones de la variable aleatoria respuesta. El mtodo de mnimos cuadrados considera la desviacin de la observacin Y, de su valor medio y determina los valores de 0 y 1 que minimizan la suma de los cuadrados de estas desviaciones. La i- sima desviacin o error es

i = Yi (0 + 1xi)
Y la suma de los cuadrados de los errores es:

Ecuacin (2)

i 2 = (Yi 0 - 1xi)
i =1 i =1

Ecuacin (3)

Los estimadores de mnimos cuadrados de 0 y 1 se obtienen mediante la diferenciacin de la ecuacin 3 con respecto a 0 y 1 y despus de igualar cada derivada parcial con cero, es decir:

Ing. Jos Carlos Delgado Chong

i 2 o

= 2

(Yi 0 - 1xi) = 0

Y
i 2 o

= 2 Xi (Yi 0 - 1xi) = 0

Donde 0

y 1 son los estimadores de mnimos cuadrados de 0 y 1, respectivamente. Al simplificar y distribuir las sumas en estas ecuaciones, se tiene

Yi = no + 1 Xi
i =1 i =1

XiYi = o Xi + 1 Xi 2
i =1 i =1 i =1

Ecuacin (4)

Las dos ecuaciones dadas por se conocen como ecuaciones normales. Dadas las realizaciones y1,y2,,yn las ecuaciones pueden resolverse para los estimados de mnimos cuadrados b0 y b1. Si se dividen ambos miembros de la primera ecuacin entre n, se obtiene:

yi = b
n

+ b1

Xi ;
n

Entonces el estimador de mnimos cuadrados de 0 es

b0 =

Yi
i =1

b1

Xi
i =1

- b1 x

Ecuacin (5)

Al sustituir b0 en la segunda ecuacin de (4) se obtiene:

xiyi =

yi n

b1

xi xi + b xi n

la que, despus de resolver para b1, se reduce a:

Ing. Jos Carlos Delgado Chong

b1 =

n n xi yi n i =1 i =1 xiyi n i =1 xi n i =1 xi 2 n i =1
n 2

( xi x)( yi y)
i =1

( xi x)
i =1

Ecuacin (6)

Los valores dados por las ecuaciones (5) y (6) son aquellos que minimizan la suma de los cuadrados de los errores. Dados los estimadores de mnimos cuadrados 0 y 1 para la interseccin y la pendiente, respectivamente, la recta de regresin estimada para el modelo de la ecuacin (1) es:

i = 0 + 1 xi

Ecuacin (7)

Donde i es el estimador para la media de la observacin Yi , la cual corresponde al valor Xi de la variable de prediccin. Ntese que si se sustituye en la ecuacin (5) por Bo en la ecuacin (7) se obtiene una forma alternativa para la recta de regresin estimada, la cual se encuentra dada por:

i = - 1 x + 1 xi = + 1(Xi - x )
Ecuacin (8)

Con base en la ecuacin (2), la diferencia entre la realizacin Yi y el valor estimado i , es un estimador del correspondiente error. Este estimador se conoce como el i- simo residual y se denota por:

i = Yi - i

Ecuacin (9)

De nuevo, ntese que los residuos no son estimados en el sentido clsico de la estimacin de parmetros (fijos), sino que son estimadores de los valores de las variables aleatorias no observables i, los cuales se obtienen de la recta de regresin estimada. Los residuos e1, e2, ., en son muy importantes debido a que proporcionan una abundante informacin sobre lo que puede faltar del modelo de regresin estimado. Ms adelante se darn ms detalles con respecto a lo anterior. En este momento se ilustrarn los pesos de clculo para obtener la recta de regresin estimada para el modelo lineal simple empleando para ello los datos de las rentas.

Ing. Jos Carlos Delgado Chong


En la tabla siguiente, se incluyen los clculos bsicos necesarios obtener los estimadores de mnimos cuadrados de la interseccin pendiente. Las ltima cuatro columnas de esta tabla no son necesarias la determinacin de b0 y b1, estas sern empleadas despus en contexto. para y la para otro

Mediante el empleo de las ecuaciones (5) y (6) el estimador de mnimos cuadrados para la pendiente es:

830.425
b1 =

(45.6)( 270.8) 15 = 8.1185 ( 45.6) 2 139.51 15

Y el correspondiente estimado de mnimos cuadrados para la interseccin es 270.8 45.6 (8.1185) = 6.6269 15 15

b0 =

Tabla 2 Clculos bsicos para obtener los estimadores de mnimos cuadrados b0 y b1 (con base en los datos de las rentas dadas en la primera tabla)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 totales

xi yi Locales Renta 2.95 18.5 3.2 20 3.4 21.1 3.6 22.4 3.2 21.2 2.85 15 3.1 18 2.85 18.8 3.05 15.7 2.7 14.4 2.75 15.5 3.1 17.2 3.15 19 2.95 17.2 2.75 16.8 45.600

xiyi 54.575 64 71.74 80.64 67.84 42.75 55.8 53.58 47.885 38.88 42.625 53.32 59.85 50.74 46.2

xi 2 8.7025 10.24 11.56 12.96 10.24 8.1225 9.61 8.1225 9.3025 7.29 7.5625 9.61 9.9225 8.7025 7.5625

yi 2 342.25 400 445.21 501.76 449.44 225 324 353.44 246.49 207.36 240.25 295.84 361 295.84 282.24

yi TESTADA 17.32 19.35 20.98 22.60 19.35 16.51 18.54 16.51 18.13 15.29 15.70 18.54 18.95 17.32 15.70

yi-yi 1.18 0.65 0.12 -0.20 1.85 -1.51 -0.54 2.29 -2.43 -0.89 -0.20 -1.34 0.05 -0.12 1.10

(yi-yi)2 1.386112006 0.419521821 0.015376746 0.039879699 3.41401392 2.282566205 0.292079655 5.240361539 5.92688001 0.797520227 0.039587225 1.796789964 0.002876236 0.015047296 1.212277218

dev stand 0.106624 0.032270909 0.001182827 0.003067669 0.262616455 0.175582016 0.022467666 0.403104734 0.455913847 0.06134771 0.003045171 0.138214613 0.000221249 0.001157484 0.093252094

270.8 830.425 139.51 4970.12

270.8 0.00000 22.88088977 1.760068444

b1=

8.1185

dato buscado valor obtenido

3.3 20.16415

Ing. Jos Carlos Delgado Chong


6.6269

bo=

De acuerdo con lo anterior, la ecuacin estimada de regresin es:

i = 6.6269 + 8.1185 xi

Ecuacin (10)

Al intentar interpretar esta ecuacin se tiene que los valores i son los estimadores para las medias de las distribuciones de probabilidad de los salarios iniciales correspondientes a las calificaciones promedio X i. Tener una interseccin negativa resulta absurdo, ya que, por ejemplo, si X = 0.5, = -2.57, lo cual es absurdo. Pero las superficies promedio en este conjunto de datos varan de 2.70 a 3.60, por lo tanto, cualquiera que sea la validez que tiene la ecuacin estimada de regresin al predecir las rentas iniciales promedio se mantiene, para todos aquellos valores de X que se encuentren entre 2.70 y 3.60. En la prctica valuatoria, muchas veces se desea predecir la respuesta ms all del intervalo de valores de X para los cuales se obtuvo la ecuacin estimada de regresin. Si un valor de X se encuentra muy cercano a este intervalo, la prediccin tendr cierta validez. De otra forma, sta debe verse con mucho cuidado, ya que la ecuacin de regresin estimada puede no ser apropiada para un intervalo de valores ms amplio de la variable de prediccin. La interpretacin del valor estimado de la pendiente es directa. El incremento estimado en la renta inicial promedio para cada aumento igual a 100 m2 de la superficie promedio es de $8,120.00 La tercera columna de la derecha en la tabla 2, contiene las rentas de mercado promedio para cada superficie promedio dada por la ecuacin (10). Por ejemplo, si para una X = 2.95, la renta inicial estimada promedio es =-6.63+ 8.12(2.95) =17,322.67. Dado que el correspondiente valor observado es 18.5, de la ecuacin (9), e = 18.5 - 17.32 = 1.18 que es el residuo para X = 2.95. En otras palabras, el valor residual 1.18 es la distancia vertical que existe entre la observacin 18.5 y el punto sobre la recta estimada de regresin para X = 2.95. Los otros residuos se obtienen de la misma manera y tiene significados similares. La grfica siguiente ilustra los residuos como distancias verticales desde la recta de regresin estimada. Dado que un residuo representa la cantidad en la que un valor estimado falla para predecir la media de la correspondiente observacin aleatoria, entre ms grandes son las magnitudes de los residuos, mayor tender a ser el efecto de la componente aleatoria en el modelo. Reacurdese que la varianza 2 de la variable respuesta es igual a la varianza del error y sta es constante para todos los valores de la variable de prediccin. En general, dado que el valor de 2 no se conoce, puede obtenerse un estimador de ste a partir de los estimados de mnimos

Ing. Jos Carlos Delgado Chong


cuadrados b0 y b1 Dado que cada i estima la media de Yi, la diferencia i representa la desviacin de Yi con respecto a su propia media.

Yi -

La suma de los cuadrados de estas diferencia, dividida entre una constante apropiada, es la forma en la que se determina una varianza. Pero estas diferencias son los residuos, por lo tanto, la suma de los cuadrados de los residuos dividida entre una constante apropiada es un estimador de 2. La constante apropiada es n - 2, ya que se pierden dos grados de libertad al tener que estimar los dos parmetros 0 y 1 antes de obtener i . Es estimador de 2 se denota como S2 y esta dado por:

S2 =

(Yi - Yi ) 2
i =1

ei
i =1

Ecuacin (11)

n2

n2

Residuos como distancia a la Ecuacin de Regresin


25

y = 8.1185x - 6.6269
20

15 Renta 10 5 0 2.4 2.6 2.8 3 3.2 3.4 3.6 3.8 Superficie Locales

Ing. Jos Carlos Delgado Chong


Residuos como distancias verticales desde la ecuacin estimada de regresin.

El estimador S2 recibe el nombre de varianza residual, y la raz cuadrada positiva S se conoce como la desviacin estndar residual. Para el ejemplo de las rentas iniciales, la varianza residual es S2 = 22.8671/13 = 1.759. La varianza residual S2 es una medida absoluta de qu tan bien se ajusta la recta estimada de regresin a las medias de las observaciones de la variable respuesta. Por lo tanto, en general entre ms pequeo sea le valor de S2, se ajustar mejor el modelo. Puede demostrarse que el estimador S2 es un estimador no sesgado de 2 con tal de que la forma del modelo de regresin sea la correcta. De otra manera, S2 estima 2 ms una componente que es el sesgo causado por un error en el modelo.

S-ar putea să vă placă și